banner
Lar / blog / Nova parceria com a Microsoft acelera o desenvolvimento de IA generativa
blog

Nova parceria com a Microsoft acelera o desenvolvimento de IA generativa

Jul 28, 2023Jul 28, 2023

Junte-se aos principais executivos em São Francisco de 11 a 12 de julho para saber como os líderes estão integrando e otimizando os investimentos em IA para o sucesso. Saber mais

Uma das tendências mais quentes em inteligência artificial (IA) este ano foi o surgimento de modelos populares de IA generativa. Com tecnologias como DALL-E e Stable Diffusion, há um número crescente de startups e casos de uso que estão surgindo.

A IA generativa se baseia em várias tecnologias fundamentais, incluindo o uso de modelos de transformadores. O uso de transformadores para IA generativa e outros casos de uso pode consumir muitos recursos no lado da inferência, onde os sistemas prevêem e criam os resultados de um modelo.

Entre os fornecedores que estão desenvolvendo tecnologia para ajudar a acelerar a inferência de IA para modelos de transformadores está a startup d-Matrix, que levantou US$ 44 milhões em uma rodada de financiamento da série A em abril para ajudar a desenvolver sua tecnologia de hardware acelerador de IA. A empresa desenvolveu uma tecnologia de computação digital na memória (DIMC) que ainda não está disponível publicamente, mas já chamou a atenção da Microsoft.

A Microsoft e a d-Matrix anunciaram hoje que o aprendizado de reforço do Microsoft Project Bonsai será suportado na tecnologia d-Matrix DIMC, que os dois fornecedores esperam fornecer uma aceleração significativa para a inferência de IA.

Transforme 2023

Junte-se a nós em São Francisco de 11 a 12 de julho, onde os principais executivos compartilharão como eles integraram e otimizaram os investimentos em IA para o sucesso e evitaram armadilhas comuns.

“O Projeto Bonsai é uma plataforma que permite nossa versão de aprendizado de reforço profundo e chamamos isso de ensino de máquina”, disse Kingsuk Maitra, principal engenheiro de IA aplicada da Microsoft, ao VentureBeat. "Treinamos um compilador para a tecnologia de computação em memória digital única da d-Matrix e os primeiros resultados são muito encorajadores."

O Projeto Bonsai está em desenvolvimento na Microsoft há vários anos e está atualmente disponível como uma prévia.

Maitra disse que o objetivo do esforço é abstrair as complexidades associadas às redes profundas de aprendizado por reforço. Um alvo inicial para o Projeto Bonsai são os controles industriais, incluindo design e fabricação de chips. Parte da tecnologia é a capacidade de treinar modelos usando uma linguagem de alto nível desenvolvida no Microsoft Project Bonsai chamada Inkling para treinar agentes de reforço profundo para realizar tarefas de controle.

O aprendizado por reforço profundo não requer dados rotulados, explicou Maitra. Em vez disso, ele aprende essencialmente com feedback do ambiente, que pode ser emulado com um simulador. No final de um loop de treinamento, o resultado é um agente de aprendizado por reforço (RL) treinado, que a Microsoft chama de "cérebros". Os cérebros, quando implantados, podem realizar ações significativas para concluir a tarefa em questão.

“Estamos executando cargas de trabalho ativas da vida real e treinando o compilador, em relação a essas cargas de trabalho da vida real, a maioria delas com grandes modelos de linguagem conhecidos com diferentes cérebros Bonsai”, disse Maitra.

Atualmente, a d-Matrix não possui nenhum chip disponível publicamente, mas o primeiro, de codinome Corsair, deve estrear em 2023.

“Estamos construindo uma plataforma de computação acelerada para transformadores e especificamente focada em IA generativa”, disse Sudeep Bhoja, cofundador e CTO da d-Matrix à VentureBeat.

Bhoja explicou que os chips que a d-Matrix está desenvolvendo podem ser construídos de forma muito modular e podem ser empacotados junto com uma CPU ou podem ser integrados em uma placa PCI que se conecta a um servidor na nuvem. A tecnologia d-Matrix foi projetada para ajudar a acelerar a inferência de IA, com sua tecnologia DIMC que oferece alto desempenho e baixa latência.

Com o Projeto Bonsai da Microsoft, a d-Matrix agora tem um compilador que pode construir ferramentas de aprendizado de reforço profundo para seu silício. Um dos principais objetivos finais da d-Matrix é ajudar a apoiar o crescimento contínuo e a implantação de modelos generativos de IA.

“Queremos habilitar [modelos de IA generativa] porque requer muito poder de processamento, há restrições de latência e é voltada para o usuário”, disse Bhoja. "Você precisa ser capaz de fazer isso de uma maneira muito eficiente em termos de energia, para que os data centers não precisem trazer mais energia...".