IA pode dar maior poder a informática?

IA
Los investigadores del MIT están entrenando un par de redes adversas generativas, o GAN, para imitar las texturas de la tierra, el mar y las nubes que se ven en las imágenes satelitales con el objetivo de eventualmente visualizar el aumento del nivel del mar en el mundo real. Es uno de los muchos proyectos de investigación de inteligencia artificial que fueron posibles gracias a los créditos en la nube donados por IBM y Google. Imagen: Brandon Leshchinskiy

Views: 64

Os provedores comerciais de serviços em nuvem aumentam a computação em inteligência artificial no MIT.

Artigo MIT de Kim Martineau : As redes neurais deram aos pesquisadores uma ferramenta poderosa para olhar para o futuro e fazer previsões com IA. Mas uma desvantagem é a necessidade insaciável de poder de dados e computação para processar todas essas informações. No MIT, a demanda por computação é estimada em cinco vezes maior do que o que o Instituto pode oferecer. Para ajudar a aliviar a crise, a indústria entrou em cena. Um supercomputador de US $ 11,6 milhões recentemente doado pela IBM fica on-line neste outono e, no ano passado, a IBM e o Google forneceram créditos em nuvem ao MIT Quest for Intelligence para distribuição em todo o campus. Quatro projetos forma possiveis pelas doações em nuvem da IBM e do Google são destacados abaixo.

Redes neurais menores, mais rápidas e mais inteligentes IA

Para reconhecer um gato em uma foto, um modelo de aprendizado profundo pode precisar ver milhões de fotos antes que seus neurônios artificiais “aprendam” a identificar um gato. O processo é computacionalmente intensivo e acarreta um alto custo ambiental, como destacaram novas pesquisas que tentam medir a pegada de carbono da inteligência artificial IA.

Mas pode haver uma maneira mais eficiente. Uma nova pesquisa do MIT mostra que os modelos apenas uma fração do tamanho são necessários. “Quando você treina uma grande rede, há uma pequena que poderia ter feito tudo”, diz Jonathan Frankle, um estudante de pós-graduação no Departamento de Engenharia Elétrica e Ciência da Computação (EECS) do MIT.

Com o co-autor do estudo e o professor Michael Carbin do EECS, Frankle estima que uma rede neural poderia sobreviver com um décimo do número de conexões se a sub-rede correta fosse encontrada desde o início. Normalmente, as redes neurais são cortadas após o processo de treinamento, com as conexões irrelevantes removidas. Por que não treinar o pequeno modelo, Frankle se perguntou?

Experimentando uma rede de dois neurônios em seu laptop, Frankle obteve resultados encorajadores e mudou-se para conjuntos de dados de imagem maiores, como MNIST e CIFAR-10, emprestando GPUs onde pudesse. Finalmente, por meio do IBM Cloud, ele garantiu energia computacional suficiente para treinar um modelo ResNet real. “Tudo o que eu fiz anteriormente foram experiências com brinquedos”, diz ele. “Finalmente, consegui executar dezenas de configurações diferentes para garantir que eu pudesse fazer as reivindicações em nosso artigo”.

Frankle falou dos escritórios do Facebook, onde trabalhou durante o verão para explorar as idéias levantadas pelo seu artigo de Hipótese de Bilhete de Loteria, um dos dois escolhidos para o prêmio de melhor artigo na Conferência Internacional sobre Representações de Aprendizagem deste ano. Aplicações potenciais para o trabalho vão além da classificação de imagens, diz Frankle, e incluem aprendizado por reforço e modelos de processamento de linguagem natural. Os pesquisadores da Facebook IA Research, Universidade de Princeton e Uber já publicaram estudos de acompanhamento.

“O que eu mais amo nas redes neurais é que ainda não lançamos as bases”, diz Frankle, que recentemente mudou do estudo de criptografia e política de tecnologia para a IA. “Realmente não entendemos como ele aprende, onde é bom e onde falha. Isso é física mil anos antes de Newton. ”

Distinguir fato de notícias falsas IA

Plataformas de rede como o Facebook e o Twitter tornaram mais fácil do que nunca encontrar notícias de qualidade. Mas, com muita frequência, as notícias reais são abafadas por informações falsas enganosas ou totalmente publicadas online. A confusão sobre um vídeo recente da presidente da Câmara dos EUA, Nancy Pelosi, medicada para fazê-la parecer bêbada, é apenas o exemplo mais recente da desinformação de ameaças e notícias falsas que representam para a democracia.

“Você pode colocar praticamente qualquer coisa na internet agora, e algumas pessoas vão acreditar”, diz Moin Nadeem, graduado sênior do EEC no MIT.

Se a tecnologia ajudou a criar o problema, também pode ajudar a corrigi-lo. Essa foi a razão de Nadeem escolher um projeto superUROP focado na construção de um sistema automatizado para combater notícias falsas e enganosas. Trabalhando no laboratório de James Glass, pesquisador do Laboratório de Ciência da Computação e Inteligência Artificial IA do MIT, e supervisionado por Mitra Mohtarami, Nadeem ajudou a treinar um modelo de linguagem para verificar fatos, pesquisando na Wikipedia e em três tipos de fontes de notícias classificadas por jornalistas. alta qualidade, qualidade mista ou baixa qualidade.

Para verificar uma reivindicação, o modelo mede o grau de concordância das fontes, com pontuações mais altas de concordância indicando que a reivindicação provavelmente é verdadeira. Uma alta pontuação de desacordo em uma alegação como “ISIS se infiltra nos Estados Unidos” é um forte indicador de notícias falsas. Uma desvantagem desse método, ele diz, é que o modelo não identifica a verdade independente, mas descreve o que a maioria das pessoas pensa ser verdade.

Com a ajuda do Google Cloud Platform, Nadeem realizou experiências e construiu um site interativo que permite aos usuários avaliar instantaneamente a precisão de uma reivindicação. Ele e seus co-autores apresentaram seus resultados na conferência da Associação Norte-Americana de Linguística Computacional (NAACL) em junho e continuam a expandir o trabalho.

“O ditado costumava ser que ver é acreditar”, diz Nadeem, neste vídeo sobre seu trabalho. “Mas estamos entrando em um mundo onde isso não é verdade. Se as pessoas não podem confiar em seus olhos e ouvidos, isso se torna uma questão em que podemos confiar? ”

Visualizando um clima quente IA

Do aumento do mar ao aumento da seca, os efeitos das mudanças climáticas já estão sendo sentidos. Daqui a algumas décadas, o mundo será um lugar mais quente, mais seco e mais imprevisível. Brandon Leshchinskiy, um estudante de pós-graduação no Departamento de Aeronáutica e Astronáutica do MIT (AeroAstro), está experimentando redes adversárias generativas, ou GANs, para imaginar como será a Terra então.

Os GANs produzem imagens hiper-realistas colocando uma rede neural contra outra. A primeira rede aprende a estrutura subjacente de um conjunto de imagens e tenta reproduzi-las, enquanto a segunda decide quais imagens parecem implausíveis e diz à primeira rede para tentar novamente.

Inspirado por pesquisadores que usaram GANs para visualizar projeções de aumento do nível do mar a partir de imagens de rua, Leshchinskiy queria ver se as imagens de satélite poderiam personalizar as projeções climáticas da mesma forma. Com seu orientador, o professor de AeroAstro Dava Newman, Leshchinskiy está atualmente usando créditos IBM Cloud gratuitos para treinar um par de GANs em imagens da costa leste dos EUA com seus pontos de elevação correspondentes. O objetivo é visualizar como as projeções de elevação do nível do mar para 2050 redesenharão a costa. Se o projeto funcionar, Leshinskiy espera usar outros conjuntos de dados da NASA para imaginar a acidificação oceânica futura e as mudanças na abundância de fitoplâncton.

“Passamos do ponto de mitigação”, diz ele. “Visualizar como será o mundo daqui a três décadas pode nos ajudar a nos adaptar às mudanças climáticas.”

Identificando atletas com alguns gestos

Alguns movimentos no campo ou quadra são suficientes para um modelo de visão computacional identificar atletas individuais. Isso está de acordo com a pesquisa preliminar de uma equipe liderada por Katherine Gallagher, pesquisadora do MIT Quest for Intelligence.

A equipe treinou modelos de visão computacional em gravações de vídeo de partidas de tênis e jogos de futebol e basquete e descobriu que os modelos podiam reconhecer jogadores individuais em apenas alguns quadros de pontos-chave do corpo, fornecendo um esboço do esqueleto.

A equipe usou uma API do Google Cloud para processar os dados de vídeo e comparou o desempenho de seus modelos com os modelos treinados na plataforma de IA do Google Cloud. “Essa informação de pose é tão distinta que nossos modelos podem identificar jogadores com precisão quase tão boa quanto os modelos fornecidos com muito mais informações, como cor do cabelo e roupas”, diz ela.

Seus resultados são relevantes para a identificação automatizada de jogadores em sistemas de análise esportiva e podem fornecer uma base para pesquisas adicionais sobre inferir o cansaço dos jogadores para prever quando os jogadores devem ser trocados. A detecção automatizada de pose também pode ajudar os atletas a refinar sua técnica, permitindo que eles isolem os movimentos precisos associados ao movimento especialista de um jogador de golfe ou ao swing vencedor de um jogador de tênis.

IA

Artigo relacionado: IA Gen – Nova linguagem de programação vai além do aprendizado profundo

Seja o primeiro a comentar

Faça um comentário

Seu e-mail não será publicado.


*