“Você é apenas um robô, uma imitação. Um robô pode escrever uma sinfonia? — entrevista sobre IA com Dmitry Soshnikov, Microsoft

Lar / Janelas 7

Você é apenas um robô, uma imitação da vida- um episódio do filme “I, Robot” com Will Smith, cuja filmagem se tornou um meme popular na Internet.

Origem

O filme de ficção científica “I Robot” foi lançado em 2004. Estrelando Will Smith. Em um episódio, o personagem de Smith, Del Spooner, interroga o robô Sunny.

Del: Você é apenas uma máquina, apenas uma imitação da vida. Um robô comporá uma sinfonia? Será que um robô transformará um pedaço de tela em uma obra-prima de arte?

Sunny: E você? "Eu, robô"

Este trecho circulou online pela primeira vez como uma microcômica. Alguém tirou screenshots do filme e colocou legendas nelas. O episódio em si é bastante engraçado, por isso o formato se tornou viral. Mais tarde, eles fizeram disso um meme, no qual as palavras do diálogo ou os rostos dos personagens foram substituídos.

Significado

O meme “Você é apenas um robô, imitação da vida” é usado para piadas sobre a superioridade da inteligência artificial sobre os humanos, por exemplo, em notícias sobre tecnologias futuras. Essas imagens são frequentemente usadas para ilustrar piadas sobre as deficiências ou estereótipos de uma pessoa, incluindo aqueles baseados em raça.

Amostra

Will Smith bebe café

Outro episódio do filme “Eu, Robô” virou meme, embora não tão popular. Esse é o momento em que o personagem de Will Smith toma café e faz cara feia, provavelmente por causa do gosto ruim. Então ele espirra e diz: “Desculpe, sou alérgico a besteiras”. A cena do herói fazendo uma careta tornou-se um modelo que pode ser usado para expressar descontentamento ou repulsa.

Galeria

O desenvolvimento de elementos de sistemas de inteligência artificial está se desenvolvendo ativamente e se tornando uma tendência atual, e apenas os preguiçosos não escrevem bots inteligentes. É por isso que entrevistamos Dmitry Shwars Soshnikov, um dos melhores especialistas em IA do país. É evangelista da tecnologia Microsoft, autor de livros, artigos e tutoriais, além de coordenador de professores e alunos, especialista em programação funcional, redes neurais e inteligência artificial.


- Dmitry, por favor, conte-nos algumas palavras sobre você e seu trabalho.

Dmitry Soshnikov: Como evangelista da Microsoft, estou envolvido na promoção e implementação dos mais tecnologias modernas empresas, agora estas são principalmente tecnologias relacionadas à inteligência artificial. Isso inclui palestrar em conferências, trabalhar com alunos e professores, startups, às vezes participar de hackfests e programar sistemas de protótipos junto com desenvolvedores de diferentes empresas. Também popularizo a programação funcional e a linguagem F#, dou aulas no MIPT, HSE e MAI e desenvolvo cursos online para MVA e Coursera.

Na minha opinião redes neurais e a inteligência artificial em geral é uma área muito interessante, cujo rápido desenvolvimento nos últimos anos já permitiu resolver uma série de problemas que antes não tinham solução, como, por exemplo, detecção automática a idade de uma pessoa com base em sua fotografia. E o futuro reserva muitas outras oportunidades interessantes para nós.

Redes Neurais – moda ou ferramenta?

- O que exatamente está em ultimamente motivou o desenvolvimento ativo da tecnologia de redes neurais?

Dmitry Soshnikov: Vários fatores se sobrepuseram com sucesso aqui.
Primeiro, o poder computacional acessível tornou-se disponível. Além disso, eles desempenharam um grande papel serviços em nuvem, porque em vez de investir na infraestrutura de cálculo de redes neurais, agora você pode alugá-la apenas durante os cálculos, recusando-se posteriormente a alugar. Além disso, os processadores gráficos, que foram originalmente projetados para computação gráfica. Descobriu-se que eles são adequados para tarefas de inteligência artificial.

Em segundo lugar, graças à Internet, começaram a acumular-se quantidades gigantescas de dados em muitas áreas. Consideremos, por exemplo, a tarefa anteriormente mencionada de reconhecer a idade de uma pessoa a partir de uma fotografia. Para treinar uma rede neural para resolvê-lo, são necessárias centenas de milhares de exemplos. Agora você pode pegar qualquer rede social, onde as próprias pessoas publicam suas fotos e informações de conta (idade) - e imediatamente recebemos dados para treinamento.
Em terceiro lugar, é claro, surgiram algumas pesquisas interessantes, incluindo novas arquiteturas de redes neurais que permitem resolver problemas existentes. Mas este ponto é provavelmente uma consequência dos dois primeiros. Quando recursos e tecnologias estão disponíveis, a área começa naturalmente a desenvolver-se ativamente.

Também apareceu aqui um grande número de ferramentas que permitem o uso dessas redes neurais. Se antes para resolver problemas de inteligência artificial era necessário ter muito conhecimento e muita programação, agora existem serviços disponíveis que você pode pegar e usar.

O tema da inteligência artificial é muito popular hoje. Quanto dessa popularidade é merecida? A tecnologia é realmente impressionante ou é uma grande contribuição da moda? E esta “moda” não é prejudicial ao desenvolvimento?

Dmitry Soshnikov: De fato, existem grandes sucessos no campo da IA, sobre os quais se escreve muito, por isso a frase “inteligência artificial” é amplamente ouvida. Graças a isso, novos desenvolvedores aparecem - alguém vai estudar uma nova área para si, ou seja, Tem mais gente que entende dessa área. Por outro lado, as pessoas estão mais atentas às tarefas onde as tecnologias de inteligência artificial podem ser aplicadas. Deste ponto de vista, tudo isto é, em princípio, bom, porque temos a oportunidade de automatizar algumas áreas que antes não conseguíamos automatizar.

Por exemplo, podemos resolver o problema de aceitação de pedidos na janela do MacAuto. Eles sempre tentam baratear a solução desses problemas. Por exemplo, nos EUA, primeiro um americano sentava lá, depois houve uma tentativa de terceirizar isso transferindo a voz para um país com mão de obra barata (onde, novamente, a pessoa senta e transcreve). E agora um computador pode fazer isso.

Os participantes do mercado têm expectativas inflacionadas? Há alguma previsão que, na sua opinião, definitivamente não se concretizará num futuro próximo?

Dmitry Soshnikov: Claro que existe. Em primeiro lugar, o campo da inteligência artificial é um pouco romântico. Existem alguns filmes - por exemplo, "Matrix" ou "O Exterminador do Futuro" - onde os robôs se rebelam e assumem o controle de tudo. Portanto, há um certo número de pessoas que esperam que mais 5 anos se passem e os computadores dominem o mundo. Estas expectativas aparentemente ainda estão longe da realidade. Hoje em dia, a solução de certas classes de problemas relacionados ao reconhecimento de imagens, reconhecimento de fala e aprendizado de máquina é muito bem automatizada. Mas ainda temos um longo caminho a percorrer antes de compreendermos como funciona o pensamento humano em geral. Portanto, antes de criar uma inteligência artificial que pense como uma pessoa e opere com o conhecimento acumulado, ainda há muito trabalho a ser feito. Ainda não está muito claro como fazer isso.

- E quanto às expectativas em termos de investimentos financeiros, em vez de implementação de cenários de ficção científica?

Dmitry Soshnikov: Parece-me que para tal conversa é necessário dividir o tema da inteligência artificial em componentes distintos, por se tratar de uma área muito ampla.

Se olharmos para a visão computacional, já existem avanços surpreendentes que estão agora a ser implementados nas empresas, aumentando a sua eficiência e trazendo benefícios económicos. A visão computacional já reconhece imagens melhor que o homem, sem falar no fato de que é significativamente mais barato.

Noutras áreas, como a compreensão da linguagem natural e a capacidade de raciocinar sobre tópicos arbitrários, o progresso tem sido mais modesto.

- Existem fatores que, na sua opinião, dificultam o desenvolvimento da indústria?

Dmitry Soshnikov: Para ser sincero, não vejo nenhum fator óbvio. Acho que esta é a área que mais cresce no momento.
Contudo, gostaria de salientar que a inteligência artificial é uma área que ainda requer algumas qualificações. Trabalhar nessa direção é um pouco mais difícil do que apenas aprender a programar. Uma pessoa que se formou na escola e não recebeu ensino superior provavelmente poderá começar a trabalhar com sucesso na área de desenvolvimento de padrões. Com a inteligência artificial, a barreira de entrada é mais elevada, embora esteja a diminuir gradualmente, inclusive através dos esforços dos participantes nesta indústria. Em particular, uma das coisas em que a Microsoft está a trabalhar é a chamada democratização da inteligência artificial. Isto significa tornar a tecnologia acessível ao mais amplo segmento possível de consumidores.

Na prática, não só a Microsoft, mas também muitas outras empresas estão trabalhando nessa direção, fornecendo, por exemplo, ferramentas para resolver problemas intelectuais e cognitivos na forma de serviços prontos. Por exemplo, serviços para determinar o sexo, idade e humor de uma pessoa a partir de uma fotografia, você pode simplesmente ligar para eles e obter o resultado. O mesmo se aplica à tradução automática, etc. Como parte do relatório do DotNext 2017, falaremos sobre isso: como você pode, sem entender exatamente como funciona, simplesmente usar os resultados.

A.NET talvez?

- Vamos falar sobre o lugar da plataforma .NET no segmento de inteligência artificial. Quão adequado é para resolver esses problemas? Existem recursos que ajudam ou, ao contrário, atrapalham o trabalho com redes neurais?

Dmitry Soshnikov: Os métodos de IA podem ser implementados em qualquer tecnologia. No entanto, existem certos ecossistemas estabelecidos em torno de tarefas semelhantes. Por exemplo, Python e R e suas bibliotecas que as acompanham são linguagens muito populares entre os cientistas de dados. Aqueles. já há muito trabalho comunitário aqui. Em termos desses desenvolvimentos, é claro, o .NET está um pouco atrás, assim como outras plataformas semelhantes. No entanto, o .NET já possui um determinado conjunto de ferramentas, das quais falarei como parte do meu relatório.

Em geral, as plataformas estão agora, de certa forma, integradas, inclusive entre si. A mesma linguagem R integra-se muito bem com F#, que é nativo da plataforma .NET. Assim, se precisarmos usar algumas ferramentas de aprendizado de máquina, podemos usar essa cadeia, usando os recursos e bibliotecas da linguagem R. Isso será bastante transparente e fácil de fazer.

Em geral, se falarmos especificamente sobre redes neurais, a Microsoft possui um Kit de Ferramentas Cognitivas que permite treinar redes neurais. E como foi originalmente construído no ecossistema da Microsoft, funciona muito bem com .NET.

- Esta ferramenta se destaca de alguma forma dos análogos de outros fabricantes?

Dmitry Soshnikov: Essencialmente, o Cognitive Toolkit é o análogo da Microsoft às estruturas TensorFlow, Caffe, etc.

Todos eles são, em princípio, muito semelhantes ideologicamente. Mas o Microsoft Cognitive Toolkit foi o primeiro a oferecer suporte a um ambiente de aprendizagem muito distribuído, onde você pode treinar uma rede neural não apenas em uma GPU, mas em várias. GPU ou mesmo em múltiplas estações gráficas. Aqueles. Você pode criar um farm de treinamento de rede neural.

Pelo que eu sei, o Cognitive Toolkit supera outras estruturas em termos de velocidade de aprendizado. Além disso, é muito conveniente de usar. A maioria das estruturas está de alguma forma relacionada a Linguagem Python, e o Cognitive Toolkit inicialmente seguiu um caminho um pouco diferente. Inicialmente foi possível descrever a arquitetura de uma rede neural em uma linguagem especial e depois treiná-la sem construir nenhum modelo em Python. Foi um pouco mais fácil. Atualmente o Cognitive Toolkit oferece suporte a ambas as opções, ou seja, é bastante flexível.

- Provavelmente há momentos em que o Cognitive Toolkit é inferior aos seus análogos?

Dmitry Soshnikov: Em geral, essas estruturas são ferramentas de baixo nível sobre as quais redes neurais arbitrárias podem ser treinadas. Assim como seus análogos, o Cognitive Toolkit suporta uma determinada camada base sobre a qual você pode construir arquiteturas de redes de complexidade arbitrária. Portanto, a gama de tarefas resolvidas por diferentes ferramentas é aproximadamente a mesma.

A escolha da estrutura é amplamente determinada por algumas preferências pessoais e pela disponibilidade de materiais de referência. E aqui o framework da Microsoft fica um pouco para trás, já que apareceu um pouco mais tarde, então não existe tal coisa para isso grande quantidade materiais, em especial cursos on-line. Mas a situação, é claro, está gradualmente se estabilizando.

Nós, juntamente com o MIPT, planejamos lançar um curso online dedicado especificamente aos problemas associados ao uso da inteligência artificial na prática. E algumas informações do Cognitive Toolkit também serão incluídas lá.

Futuro próximo

- É possível prever agora em que direção está indo o desenvolvimento do segmento de inteligência artificial?

Dmitry Soshnikov: Provavelmente é muito cedo para fazer previsões finais, uma vez que em 2011-2012 começou o desenvolvimento extremamente rápido da tecnologia. Desde então, os métodos de reconhecimento foram aprimorados, as arquiteturas de redes neurais foram aprimoradas, ou seja, a precisão da resolução de problemas aumenta.

Ainda há muitas questões não resolvidas neste segmento. Os problemas de reconhecimento de imagem e voz já foram resolvidos em um nível bastante elevado. A seguir, provavelmente o mais interessante é tentar extrair algum significado do texto. Existem alguns sucessos impressionantes aqui também. Por exemplo, você pode treinar uma rede neural em fragmentos de conversas de filmes e obter um robô que possa de alguma forma manter um diálogo. Mas, ao mesmo tempo, não haverá muito sentido no diálogo. Ainda não está claro como traduzir o conhecimento em significado, como combinar a representação implícita do conhecimento em redes neurais com o raciocínio simbólico. Esta é a direção da pesquisa que os cientistas seguirão.

Quanto às ferramentas, elas estão sendo desenvolvidas ativamente. De certa forma, os fabricantes de ferramentas estão tentando acompanhar os avanços científicos em suas respectivas áreas. Surgem novas arquiteturas de rede - seu suporte aparece em ferramentas, ou seja, A funcionalidade está em constante expansão.

Como disse anteriormente, do ponto de vista do desenvolvedor, há uma tendência notável para a democratização da inteligência artificial, incluindo ferramentas. Além do Microsoft Cognitive Toolkit que mencionei, existe uma ferramenta interessante chamada Azure Machine Learning, que permite aplicá-los a dados reais sem um conhecimento profundo da implementação de todos os algoritmos de aprendizado de máquina e ver se consegue identificar algum padrão e use-os ainda mais em seus produtos. Essa ferramenta também está sendo desenvolvida de forma bastante intensa - novos métodos e algoritmos estão sendo inseridos nela.

Em geral, a tecnologia está se tornando mais acessível. Coisas complexas são simplificadas para que possam ser usadas na maior variedade possível de projetos.
Outro ponto que gostaria de mencionar é que estas ainda são as primeiras experiências uso da nuvem soluções de hardware mais eficientes que implementam algoritmos de inteligência artificial. Não falaremos sobre isso no Dotnext, mas o tema foi discutido detalhadamente na conferência Microsoft Ignite. Na nuvem, a Microsoft planeja oferecer não apenas recursos de computação clássicos, mas também circuitos integrados lógicos programáveis: FPGA ou FPGA. Para simplificar, estes são microcircuitos que podem ser flasheados para realizar determinados operações lógicas, e que realizará essas operações muito rapidamente. Com esse esquema, podemos calcular a rede neural com muito mais rapidez. Durante os experimentos, o processador foi “solicitado” a traduzir de idioma para idioma, como resultado, o romance “Guerra e Paz” é traduzido de idioma para idioma em 2 segundos. Se você pegar todos os processadores que a Microsoft possui na nuvem, a Wikipedia poderá ser traduzida de um idioma para outro no tempo que uma pessoa leva para piscar um olho.

Mais informações práticas Dmitry falará sobre o uso de redes neurais e tecnologias de inteligência artificial em projetos reais (inclusive em .NET) em seu relatório no DotNext 2017 Piter (“Inteligência artificial disponível na plataforma .NET: de chatbots e serviços cognitivos a redes neurais profundas” ).

Tags: Adicionar tags

Um robô pode escrever uma sinfonia ou transformar um pedaço de tela em uma obra-prima de arte? Esta questão permanece em aberto. Mas aqui está o que sabemos com certeza: os nanorrobôs médicos modernos são capazes de “cortar o oxigênio” de um tumor ao penetrar na corrente sanguínea e entregar medicamentos às células afetadas sem prejudicar as saudáveis. As redes neurais estão prestes a superar os médicos no diagnóstico de muitas doenças, e os exames com tecnologias CRISPR poderão em breve ser realizados sem sair de casa. O futuro da medicina já chegou – vamos descobrir o que esperar dos novos métodos e como isso afetará a nossa saúde.

Diagnosticar: Inteligência Artificial

O sucesso do tratamento depende muito de um diagnóstico rápido e sem erros: para isso, o médico precisa acumular muita experiência prática e estar atento aos trabalhos científicos atuais em sua área. Mas com tantos novos estudos e relatos de casos publicados todos os meses, onde você pode encontrar tempo para estudar tudo isso? É aqui que os computadores vêm em auxílio das pessoas, capazes de processar grandes quantidades de informações em segundos.

Hoje, algoritmos para análise de dados médicos são criados por grandes corporações, incluindo Microsoft, IBM e Google. Na maioria das vezes, os seus desenvolvimentos baseiam-se em várias formas de inteligência artificial de autoaprendizagem que podem encontrar padrões em grandes conjuntos de dados, tais como tomografias cerebrais ou imagens de crescimentos suspeitos na pele. Tais algoritmos são treinados por meio de bibliotecas de milhares de exemplos, onde a cada imagem é atribuído um diagnóstico feito por um médico qualificado.

As redes neurais já aprenderam a identificar muitas doenças com a mesma eficácia que os humanos e, em alguns casos, conseguem até superar os especialistas.

Redes neurais convolucionais (CNN) permitem analisar múltiplas imagens. Estas são estruturas profundas (multicamadas) nas quais cada neurônio artificial recebe apenas um pequeno fragmento da saída da camada anterior. Gradualmente, a rede generaliza as características locais, recriando o quadro completo. Ao combinar todos os dados, a CNN consegue reconhecer vários detalhes da imagem original, incluindo elementos característicos com base nos quais os médicos fazem o diagnóstico.

As tecnologias CRISPR podem não apenas eliminar as causas das doenças, mas também identificar doenças, por exemplo, procurar vestígios de DNA ou RNA de agentes infecciosos.

Embora a proteína Cas9 associada ao CRISPR seja mais frequentemente mencionada em conexão com a terapia, outras proteínas: Cas12a e Cas13a são geralmente as proteínas de “diagnóstico”.

Em 2017, pesquisadores do MIT introduziram uma tecnologia de diagnóstico chamada SHERLOCK (Specific High Sensitivity Enzymatic Reporter UnLOCKing). Ele usa a enzima Cas13a, que pode reconhecer sequências específicas de RNA e cortar cadeias de RNA semelhantes localizadas nas proximidades, destruindo completamente o objeto suspeito. Assim como o livro Sherlock Holmes, o SHERLOCK médico é capaz de recriar um quadro completo dos acontecimentos a partir da menor evidência: a tecnologia funciona com concentrações atomolares (10–18 mol por litro) de ácidos nucléicos. O método foi testado em lentivírus contendo fragmentos do vírus da dengue e do vírus Zika: SHERLOCK foi capaz de detectar partículas de patógenos e distingui-las umas das outras em uma concentração de no máximo dois atomoles.

Durante os testes, descobriu-se que os reagentes para diagnóstico usando SHERLOCK podem ser secos e depois reconstituídos, enquanto a sensibilidade do método não diminui muito. Para testes portáteis, sugere-se a utilização de papel de fibra de vidro. Os autores do desenvolvimento acreditam que um sistema de teste custará aproximadamente 61 centavos.

Outros pesquisadores também estão trabalhando na criação de kits para testes CRISPR em casa. Recentemente, o desenvolvimento nesta área foi iniciado por Jennifer Doudna, uma das pioneiras da revolução médica CRISPR. Sua equipe criou um método chamado DETECTR (repórter trans CRISPR direcionado a endonuclease de DNA), usando a proteína Cas12a. Ele encontra sequências específicas de DNA e corta as moléculas repórteres de ácido nucleico marcadas com fluorescência mais próximas adicionadas à amostra, produzindo um sinal. Desta forma, podem ser detectados vestígios de patógenos de muitas doenças, incluindo diferentes cepas do vírus influenza.


Segundo os criadores desses sistemas de teste, a análise do CRISPR não levará mais do que algumas horas e os resultados poderão ser obtidos pela Internet. No entanto, quando tais conjuntos aparecem em venda aberta, ainda é desconhecido.

É uma ilusão: realidade virtual

A realidade virtual é frequentemente falada no contexto jogos de computador e “cinema volumétrico”, mas a tecnologia também tem potencial na medicina, e não nas áreas mais óbvias. Por exemplo, a RV é efetivamente usada como analgésico.

A unidade de queimados do Loyola University Hospital, em Illinois, adota essa abordagem.iniciado usado há dez anos: pacientes de hospital jogam um simulador durante procedimentos dolorososMundo da Neve.

A ação se passa tendo como pano de fundo paisagens semi-fantásticas do norte com muitos montes de neve e rios congelados, a tarefa do herói é jogar bolas de neve com ursos polares, pinguins e bonecos de neve. Para completar todos os níveis, o paciente concentra-se involuntariamente no quebra-cabeça e se distrai das sensações físicas. As ressonâncias magnéticas do cérebro mostraram que o SnowWorld realmente reduz a percepção da dor, de modo que os pacientes precisam de menos analgésicos fortes que podem ser prejudiciais ao corpo.

A RV está substituindo ou complementando os analgésicos em muitas áreas da medicina. A tecnologia é utilizada para aliviar dores durante o parto e durante procedimentos odontológicos. As propriedades analgésicas da realidade virtual são especialmente relevantes à luz da “crise dos opióides” nos Estados Unidos - está associada ao aumento da popularidade dos analgésicos prescritos (por exemplo, OxyContin e Vicodin) nas últimas décadas.

A RV não funciona apenas para dores físicas: também pode superar traumas psicológicos. Os primeiros experimentos ocorreram no final da década de 1990, quando a psicóloga Barbara Rothbaum conseguiu aliviar os sintomas do transtorno de estresse pós-traumático em veteranos do Vietnã usando modelos virtuais de cabine de helicóptero e de uma clareira na selva asiática. Essa técnica complementou a terapia de exposição - uma “abordagem” gradual de memórias traumáticas que a consciência do paciente tenta evitar. Um esquema semelhante funciona no tratamento de transtornos de ansiedade e fobias por meio da realidade virtual. A tecnologia ajuda a lidar com a aerofobia e o medo de falar em público: um ambiente simulado permite “ensaiar” repetidamente uma situação assustadora.

As desvantagens da terapia de RV são o custo relativamente alto do equipamento e a potencial intolerância fisiológica à realidade virtual.

Alguns participantes em testes de novos métodos de tratamento experimentaram “náuseas” de VR (enjôo de realidade virtual), que causa os mesmos sintomas que enjoo de movimento ou enjôo. Segundo hipóteses comuns, ambos os distúrbios surgem de distúrbios no funcionamento dos receptores do aparelho vestibular ou de um conflito entre sinais provenientes do aparelho vestibular e dos órgãos da visão.

Os desenvolvedores já criaram vários métodos que podem reduzir a “náusea” da VR. Por exemplo, você pode colocar um objeto estacionário na tela que os olhos do usuário fixarão constantemente. Os autores da tecnologia Nasum Virtualis propõem usar como ponto de referência uma imagem virtual do nariz localizada no centro da tela. Os olhos do jogador o percebem como se fosse seu próprio nariz, então a sensação de náusea e tontura diminui.

  • Programação funcional,
  • Aprendizado de máquina
  • O desenvolvimento de elementos de sistemas de inteligência artificial está se desenvolvendo ativamente e se tornando uma tendência atual, e apenas os preguiçosos não escrevem bots inteligentes. É por isso que entrevistamos Dmitry Soshnikov, um dos maiores especialistas em IA do país. É evangelista da tecnologia Microsoft, autor de livros, artigos e tutoriais, além de coordenador de professores e alunos, especialista em programação funcional, redes neurais e inteligência artificial.


    - Dmitry, por favor, conte-nos algumas palavras sobre você e seu trabalho.

    Dmitry Soshnikov: Como evangelista da Microsoft, estou envolvido na popularização e implementação das tecnologias mais modernas da empresa, agora principalmente tecnologias relacionadas à inteligência artificial. Isso inclui palestrar em conferências, trabalhar com alunos e professores, startups, às vezes participar de hackfests e programar sistemas de protótipos junto com desenvolvedores de diferentes empresas. Também popularizo a programação funcional e a linguagem F#, dou aulas no MIPT, HSE e MAI e desenvolvo cursos online para MVA e Coursera.

    Na minha opinião, as redes neurais e a inteligência artificial em geral são uma área muito interessante, cujo rápido desenvolvimento nos últimos anos já permitiu resolver uma série de problemas que antes não tinham solução, como, por exemplo, determinar automaticamente a idade de uma pessoa a partir de sua fotografia. E o futuro reserva muitas outras oportunidades interessantes para nós.

    Redes Neurais – moda ou ferramenta?

    - O que exatamente motivou recentemente o desenvolvimento ativo da tecnologia de redes neurais?

    Dmitry Soshnikov: Vários fatores se sobrepuseram com sucesso aqui.
    Primeiro, o poder computacional acessível tornou-se disponível. Além disso, os serviços em nuvem desempenharam um papel importante, pois em vez de investir em infraestrutura para cálculo de redes neurais, agora você pode alugá-la apenas durante os cálculos, recusando-se posteriormente ao aluguel. Além disso, começaram a ser utilizados processadores gráficos, originalmente projetados para computação gráfica. Descobriu-se que eles são adequados para tarefas de inteligência artificial.

    Em segundo lugar, graças à Internet, começaram a acumular-se quantidades gigantescas de dados em muitas áreas. Consideremos, por exemplo, a tarefa anteriormente mencionada de reconhecer a idade de uma pessoa a partir de uma fotografia. Para treinar uma rede neural para resolvê-lo, são necessárias centenas de milhares de exemplos. Agora você pode pegar qualquer rede social onde as próprias pessoas publicam suas fotos e informações de conta (idade) - e receberemos imediatamente os dados para treinamento.
    Em terceiro lugar, é claro, surgiram algumas pesquisas interessantes, incluindo novas arquiteturas de redes neurais que permitem resolver problemas existentes. Mas este ponto é provavelmente uma consequência dos dois primeiros. Quando recursos e tecnologias estão disponíveis, a área começa naturalmente a desenvolver-se ativamente.

    Também apareceu aqui um grande número de ferramentas que permitem o uso dessas redes neurais. Se antes para resolver problemas de inteligência artificial era necessário ter muito conhecimento e muita programação, agora existem serviços disponíveis que você pode pegar e usar.

    O tema da inteligência artificial é muito popular hoje. Quanto dessa popularidade é merecida? A tecnologia é realmente impressionante ou é uma grande contribuição da moda? E esta “moda” não é prejudicial ao desenvolvimento?

    Dmitry Soshnikov: De fato, existem grandes sucessos no campo da IA, sobre os quais se escreve muito, por isso a frase “inteligência artificial” é amplamente ouvida. Graças a isso, novos desenvolvedores aparecem - alguém vai estudar uma nova área para si, ou seja, Tem mais gente que entende dessa área. Por outro lado, as pessoas estão mais atentas às tarefas onde as tecnologias de inteligência artificial podem ser aplicadas. Deste ponto de vista, tudo isto é, em princípio, bom, porque temos a oportunidade de automatizar algumas áreas que antes não conseguíamos automatizar.

    Por exemplo, podemos resolver o problema de aceitação de pedidos na janela do MacAuto. Eles sempre tentam baratear a solução desses problemas. Por exemplo, nos EUA, primeiro um americano sentava lá, depois houve uma tentativa de terceirizar isso transferindo a voz para um país com mão de obra barata (onde, novamente, a pessoa senta e transcreve). E agora um computador pode fazer isso.

    Os participantes do mercado têm expectativas inflacionadas? Há alguma previsão que, na sua opinião, definitivamente não se concretizará num futuro próximo?

    Dmitry Soshnikov: Claro que existe. Em primeiro lugar, o campo da inteligência artificial é um pouco romântico. Existem alguns filmes - por exemplo, "Matrix" ou "O Exterminador do Futuro" - onde os robôs se rebelam e assumem o controle de tudo. Portanto, há um certo número de pessoas que esperam que mais 5 anos se passem e os computadores dominem o mundo. Estas expectativas aparentemente ainda estão longe da realidade. Hoje em dia, a solução de certas classes de problemas relacionados ao reconhecimento de imagens, reconhecimento de fala e aprendizado de máquina é muito bem automatizada. Mas ainda temos um longo caminho a percorrer antes de compreendermos como funciona o pensamento humano em geral. Portanto, antes de criar uma inteligência artificial que pense como uma pessoa e opere com o conhecimento acumulado, ainda há muito trabalho a ser feito. Ainda não está muito claro como fazer isso.

    - E quanto às expectativas em termos de investimentos financeiros, em vez de implementação de cenários de ficção científica?

    Dmitry Soshnikov: Parece-me que para tal conversa é necessário dividir o tema da inteligência artificial em componentes distintos, por se tratar de uma área muito ampla.

    Se olharmos para a visão computacional, já existem avanços surpreendentes que estão agora a ser implementados nas empresas, aumentando a sua eficiência e trazendo benefícios económicos. A visão computacional já reconhece imagens melhor que os humanos, sem falar que é significativamente mais barata.

    Noutras áreas, como a compreensão da linguagem natural e a capacidade de raciocinar sobre tópicos arbitrários, o progresso tem sido mais modesto.

    - Existem fatores que, na sua opinião, dificultam o desenvolvimento da indústria?

    Dmitry Soshnikov: Para ser sincero, não vejo nenhum fator óbvio. Acho que esta é a área que mais cresce no momento.
    Contudo, gostaria de salientar que a inteligência artificial é uma área que ainda requer algumas qualificações. Trabalhar nessa direção é um pouco mais difícil do que apenas aprender a programar. Uma pessoa que se formou na escola e não recebeu ensino superior provavelmente poderá começar a trabalhar com sucesso na área de desenvolvimento de padrões. Com a inteligência artificial, a barreira de entrada é mais elevada, embora esteja a diminuir gradualmente, inclusive através dos esforços dos participantes nesta indústria. Em particular, uma das coisas em que a Microsoft está a trabalhar é a chamada democratização da inteligência artificial. Isto significa tornar a tecnologia acessível ao mais amplo segmento possível de consumidores.

    Na prática, não só a Microsoft, mas também muitas outras empresas estão trabalhando nessa direção, fornecendo, por exemplo, ferramentas para resolver problemas intelectuais e cognitivos na forma de serviços prontos. Por exemplo, serviços para determinar o sexo, idade e humor de uma pessoa a partir de uma fotografia, você pode simplesmente ligar para eles e obter o resultado. O mesmo se aplica à tradução automática, etc. Como parte do relatório do DotNext 2017, falaremos sobre isso: como você pode, sem entender exatamente como funciona, simplesmente usar os resultados.

    A.NET talvez?

    - Vamos falar sobre o lugar da plataforma .NET no segmento de inteligência artificial. Quão adequado é para resolver esses problemas? Existem recursos que ajudam ou, ao contrário, atrapalham o trabalho com redes neurais?

    Dmitry Soshnikov: Os métodos de IA podem ser implementados em qualquer tecnologia. No entanto, existem certos ecossistemas estabelecidos em torno de tarefas semelhantes. Por exemplo, Python e R e suas bibliotecas que as acompanham são linguagens muito populares entre os cientistas de dados. Aqueles. já há muito trabalho comunitário aqui. Em termos desses desenvolvimentos, é claro, o .NET está um pouco atrás, assim como outras plataformas semelhantes. No entanto, o .NET já possui um determinado conjunto de ferramentas, das quais falarei como parte do meu relatório.

    Em geral, as plataformas estão agora, de certa forma, integradas, inclusive entre si. A mesma linguagem R integra-se muito bem com F#, que é nativo da plataforma .NET. Assim, se precisarmos usar algumas ferramentas de aprendizado de máquina, podemos usar essa cadeia, usando os recursos e bibliotecas da linguagem R. Isso será bastante transparente e fácil de fazer.

    Em geral, se falarmos especificamente sobre redes neurais, a Microsoft possui um Kit de Ferramentas Cognitivas que permite treinar redes neurais. E como foi originalmente construído no ecossistema da Microsoft, funciona muito bem com .NET.

    - Esta ferramenta se destaca de alguma forma dos análogos de outros fabricantes?

    Dmitry Soshnikov: Essencialmente, o Cognitive Toolkit é o análogo da Microsoft às estruturas TensorFlow, Caffe, etc.

    Todos eles são, em princípio, muito semelhantes ideologicamente. Mas o Microsoft Cognitive Toolkit foi o primeiro a oferecer suporte a um ambiente de treinamento altamente distribuído, onde você pode treinar uma rede neural não apenas em uma única GPU, mas em várias GPUs ou até mesmo em várias estações de GPU. Aqueles. Você pode criar um farm de treinamento de rede neural.

    Pelo que eu sei, o Cognitive Toolkit supera outras estruturas em termos de velocidade de aprendizado. Além disso, é muito conveniente de usar. A maioria dos frameworks está relacionada ao Python de uma forma ou de outra, mas o Cognitive Toolkit inicialmente seguiu um caminho um pouco diferente. Inicialmente foi possível descrever a arquitetura de uma rede neural em uma linguagem especial e depois treiná-la sem construir nenhum modelo em Python. Foi um pouco mais fácil. Atualmente o Cognitive Toolkit oferece suporte a ambas as opções, ou seja, é bastante flexível.

    - Provavelmente há momentos em que o Cognitive Toolkit é inferior aos seus análogos?

    Dmitry Soshnikov: Em geral, essas estruturas são ferramentas de baixo nível sobre as quais redes neurais arbitrárias podem ser treinadas. Assim como seus análogos, o Cognitive Toolkit suporta uma determinada camada base sobre a qual você pode construir arquiteturas de redes de complexidade arbitrária. Portanto, a gama de tarefas resolvidas por diferentes ferramentas é aproximadamente a mesma.

    A escolha da estrutura é amplamente determinada por algumas preferências pessoais e pela disponibilidade de materiais de referência. E aqui o framework da Microsoft fica um pouco para trás, pois apareceu um pouco mais tarde, então não há uma quantidade tão grande de materiais sobre ele, principalmente cursos online. Mas a situação, é claro, está gradualmente se estabilizando.

    Nós, juntamente com o MIPT, planejamos lançar um curso online dedicado especificamente aos problemas associados ao uso da inteligência artificial na prática. E algumas informações do Cognitive Toolkit também serão incluídas lá.

    Futuro próximo

    - É possível prever agora em que direção está indo o desenvolvimento do segmento de inteligência artificial?

    Dmitry Soshnikov: Provavelmente é muito cedo para fazer previsões finais, uma vez que em 2011-2012 começou o desenvolvimento extremamente rápido da tecnologia. Desde então, os métodos de reconhecimento foram aprimorados, as arquiteturas de redes neurais foram aprimoradas, ou seja, a precisão da resolução de problemas aumenta.

    Ainda há muitas questões não resolvidas neste segmento. Os problemas de reconhecimento de imagem e voz já foram resolvidos em um nível bastante elevado. A seguir, provavelmente o mais interessante é tentar extrair algum significado do texto. Existem alguns sucessos impressionantes aqui também. Por exemplo, você pode treinar uma rede neural em fragmentos de conversas de filmes e obter um robô que possa de alguma forma manter um diálogo. Mas, ao mesmo tempo, não haverá muito sentido no diálogo. Ainda não está claro como traduzir o conhecimento em significado, como combinar a representação implícita do conhecimento em redes neurais com o raciocínio simbólico. Esta é a direção da pesquisa que os cientistas seguirão.

    Quanto às ferramentas, elas estão sendo desenvolvidas ativamente. De certa forma, os fabricantes de ferramentas estão tentando acompanhar os avanços científicos em suas respectivas áreas. Surgem novas arquiteturas de rede - seu suporte aparece em ferramentas, ou seja, A funcionalidade está em constante expansão.

    Como disse anteriormente, do ponto de vista do desenvolvedor, há uma tendência notável para a democratização da inteligência artificial, incluindo ferramentas. Além do Microsoft Cognitive Toolkit que mencionei, existe uma ferramenta interessante chamada Azure Machine Learning, que permite aplicá-los a dados reais sem um conhecimento profundo da implementação de todos os algoritmos de aprendizado de máquina e ver se consegue identificar algum padrão e use-os ainda mais em seus produtos. Essa ferramenta também está sendo desenvolvida de forma bastante intensa - novos métodos e algoritmos estão sendo inseridos nela.

    Em geral, a tecnologia está se tornando mais acessível. Coisas complexas são simplificadas para que possam ser usadas na maior variedade possível de projetos.
    Outro ponto que gostaria de mencionar é que estes ainda são os primeiros experimentos na nuvem utilizando soluções de hardware mais eficientes que implementam algoritmos de inteligência artificial. Não falaremos sobre isso no Dotnext, mas o tema foi discutido detalhadamente na conferência Microsoft Ignite. Na nuvem, a Microsoft planeja oferecer não apenas recursos de computação clássicos, mas também circuitos integrados lógicos programáveis: FPGA ou FPGA. Para simplificar, são chips que podem ser atualizados para realizar certas operações lógicas e que realizarão essas operações muito rapidamente. Com esse esquema, podemos calcular a rede neural com muito mais rapidez. Durante os experimentos, o processador foi “solicitado” a traduzir de idioma para idioma, como resultado, o romance “Guerra e Paz” é traduzido de idioma para idioma em 2 segundos. Se você pegar todos os processadores que a Microsoft possui na nuvem, a Wikipedia poderá ser traduzida de um idioma para outro no tempo que uma pessoa leva para piscar um olho.

    Dmitry dará informações mais práticas sobre o uso de redes neurais e tecnologias de inteligência artificial em projetos reais (inclusive em .NET) em seu relatório no DotNext 2017 Piter (“Inteligência artificial disponível na plataforma .NET: de chatbots e serviços cognitivos a serviços profundos redes neurais").

    Etiquetas:

    • inteligência artificial
    • redes neurais
    Adicionar tags

    © 2024 ermake.ru - Sobre reparo de PC - Portal de informações