Startec

Startec

'ByoLLM': ServiceNow quer clientes operando modelos próprios de IA generativa - IT Forum

Mai 18, às 19:31

·

6 min de leitura

·

0 leituras

“Bring your own LLM”, algo como “traga seu próprio modelo amplo de linguagem”. Essa é a visão que a ServiceNow, fornecedora de soluções de automação de fluxo de trabalho, tem para sua plataforma como pretende...
'ByoLLM': ServiceNow quer clientes operando modelos próprios de IA generativa - IT Forum

Bring your own LLM”, algo como “traga seu próprio modelo amplo de linguagem”. Essa é a visão que a ServiceNow, fornecedora de soluções de automação de fluxo de trabalho, tem para sua plataforma como pretende utilizar IA generativa em suas ofertas. A visão foi explicada por Chirantan “CJ” Desai, COO da ServiceNow, durante o Knowledge 23, evento global da companhia realizado nesta semana em Las Vegas, nos Estados Unidos.

Durante o encontro, a empresa anunciou novas ferramentas de IA generativa para sua plataforma de automação de workflow, mas também detalhou sua estratégia com a tendência que tem dominado a indústria da tecnologia nos últimos meses. “Seja OpenAI ou outros LLMs de propósito geral, nós vamos prover conectores com a plataforma da ServiceNow para que você possa alavancá-las para seus casos de uso, como busca”, explicou o executivo.

Na prática, o plano da companhia é permitir que seus clientes desenvolvam seus próprios modelos amplos de linguagem (LLMs) – os motores por trás de ferramentas como o ChatGPT – customizados, contendo parâmetros específicos para os negócios de cada empresa, para dentro da plataforma da ServiceNow.

Leia também: IA generativa é novo passo da ServiceNow para automação de workflow

Isso se dará através dos chamados “LLMs específicos de domínio”. Esses modelos são menores em termos de parâmetros, mas contém dados específicos do domínio do cliente. Com isso, a ideia é gerar aplicações de IA generativa mais seguras – já que os modelos são treinados com dados que não saem do ecossistema do cliente – e com menor possibilidade de erros ou ‘alucinações’, uma vez que os dados usados para treinar parâmetros são específicos à aplicação do cliente.

“Nós não precisamos de 375 milhões de parâmetros. Nós podemos treinar, com os modelos certos de open source, para você e com seus dados. Assim você tem privacidade, confiança e outros parâmetros que importam”, pontuou CJ. Uma das formas dessa operação é o recém-anunciado ServiceNow Assist para Busca, que fornece respostas em linguagem natural aos usuários de plataformas da Service Now – como Portal Search, Next Experience ou Virtual Agent – extraindo informações usando a própria base de dados do cliente. O Assist também pode ser customizável por clientes para ser utilizado com suas próprias identidades visuais.

Para transformar a visão em realidade, a ServiceNow atuou em uma série de frentes ao longo dos últimos anos. Um passo importante foi a aquisição da Element AI, startup canadense adquirida pela ServiceNow em 2020 que ajudou na aquisição de talento e infraestrutura para a companhia californiana acelerar sua atuação em IA. “Nós conquistamos um grupo incrível de cientistas, pesquisadores, cientistas de dados e engenheiros que nos ajudaram a explorar o que nossa plataforma pode fazer com AI”, explicou CJ.

Durante o Knowledge 23, um segundo passo de peso foi revelado na forma de uma parceria com a Nvidia. O acordo permitirá que a empresa empregue software, serviços e infraestrutura acelerada da Nvidia para desenvolver modelos amplos de linguagem (LLMs) personalizados treinados em dados especificamente a plataforma ServiceNow.

Leia mais: Para Wozniak, ChatGPT pode ameaçar a todos nós

Juntas, as empresas desenvolverão assistentes virtuais inteligentes e agentes para ajudar a responder rapidamente à ampla gama de perguntas de usuários e solicitações de suporte com chatbots de IA. A expectativa é que isso gere melhor produtividade em empresas, alta precisão e mais valor à TI.

“Há a necessidade de uma IA geral, que é importante entender as nuances e a imprecisão da forma como as pessoas interagem com computadores”, Jensen Huang, fundador eCEO da Nvidia, durante uma participação especial no Knowledge 23. “Mas o que nós também precisamos fazer, e estamos fazendo na Nvidia, é criar IAs altamente especializadas. É importante termos inteligência, mas há habilidades em tarefas super específicas, informadas por conhecimento de domínio específico, que nós queremos que nossas IAs tenham.”

“Uma das minhas aplicações favoritas é texto para código no contexto de desenvolvedores de ServiceNow”, avaliou CJ durante um encontro com a imprensa. “Atualmente, não há desenvolvedores suficientes no ecossistema para configurar códigos. Então, se tivermos texto para código, qualquer um pode configurar regras de negócios, e customizações dentro de suas organizações.”

IA generativa e infraestrutura

Para entender os investimentos da ServiceNow em infraestrutura para realizar sua estratégia em IA generativa, o IT Forum conversou com Pat Casey, Chief Technology Officer (CTO) da empresa. Segundo Casey, existe ainda um entendimento “errado” na indústria de que modelos amplos de linguagem precisam de grandes quantidades de hardware para serem operados.

Esse é o caso, ele pontuou, de empresas que estão treinando os modelos primários – como a Microsoft, com o ChatGPT, ou a Nvidia, para habilitar parcerias de empresas como a ServiceNow. Na aplicação da ServiceNow, no entanto, que consiste em sub-treinar modelos nos dados específicos de seus negócios e de clientes, a demanda por poder de computação é bem menor.

“Se você estiver usando um modelo de código aberto ou um modelo em parceria e o sub-treinando, não precisará de 10 mil GPUs. Talvez você precise se cem”, avaliou o executivo. No caso da ServiceNow, boa parte da infraestrutura necessária, explicou, veio da aquisição da Element AI, mencionada anteriormente por CJ. “Entre as GPUs que eles tinham quando compramos a empresa e os investimentos que fizemos depois, temos algo na ordem de magnitude de 800 GPUs em nossos laboratórios que podemos usar para treinar os modelos que nós temos. Para treinamento, nós temos o que precisamos.”

Há, no entanto, algumas aplicações destes modelos treinados que a empresa antecipa que devem demandar um volume grande de processamento. De acordo com Casey, operações envolvendo o chatbot Virtual Agent ou envolvendo usuários finais ServiceNow, são alguns exemplos. A empresa já tem um projeto interno em andamento para avaliar qual será o poder computacional adicional necessário para suportar esses casos de uso e não descarta usar recursos de cloud pública caso necessário.

A infraestrutura operada pela empresa no Brasil, por exemplo, ainda não está pronta para algumas dessas operações. “Se fizermos uma solicitação de conclusão de código para um cliente brasileiro, ela iria para uma GPU em outro lugar. Provavelmente na América do Norte”, explicou. “Mas como não posso fazer isso sem sua permissão, você precisaria optar por isso voluntariamente. Não faríamos isso sem que o cliente explicitamente autorize por questões contratuais.”

*o repórter do IT Forum está em Las Vegas a convite da ServiceNow

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!


Continue lendo

DEV

Authentication system using Golang and Sveltekit - Dockerization and deployments
Introduction Having built out all the features of our application, preparing it for deployment is the next step so that everyone around the world will easily access it. We will deploy our apps (backend and...

Hoje, às 19:52

DEV

LEARN API AND ITS MOST POPULAR TYPE
An API (Application Programming Interface) is a set of rules and protocols that allows different software applications to communicate and interact with each other. It defines the methods, data structures, and...

Hoje, às 19:26

AI | Techcrunch

Investors take note: Wildfire smoke will spark a surge in East Coast climate tech startups
As smoke from Canadian wildfires has enveloped large swathes of the East Coast, millions of people have found themselves trapped inside, gazing out on orange skies and hazy cityscapes. The air quality index —...

Hoje, às 18:08

DEV

A Plain English Guide to Reverse-Engineering the Twitter Algorithm with LangChain, Activeloop, and DeepInfra
Imagine writing a piece of software that could understand, assist, and even generate code, similar to how a seasoned developer would. Well, that’s possible with LangChain. Leveraging advanced models such as...

Hoje, às 18:08

DEV

Finding Harmony in Marketing and UX
When we think of teamwork in the world of user experience (UX), we often imagine design and engineering working together. However, the idea of design and marketing working together is not as common. While...

Hoje, às 17:02

DEV

💡 Where to Find Inspiration for Building Your Next App
The first steps before turning your ideas into code. Whenever I’m trying to think of an idea to build a new application or website and I get stumped on what to do, there’s one phrase that always comes to...

Hoje, às 16:58

DEV

How to create 700+ SEO optimised pages for website in 1 h using Next.JS, OpenAI, Postgres
Small intro, I started learning coding couple of months before and since then experimenting with different small side projects. So this I show coding still looks for me:) What did I build this...

Hoje, às 16:37

DEV

Angular Project Mongodb database Connect | Angular Website Project | Angular App
Angular Project Mongodb database Connect | Angular Website Project | Angular App - YouTube ​ @softwaretechit Download Our App:- https://blog.softwaretechit.com/p/download.htmlWhat will we Learn In This...

Hoje, às 16:10

AI | Techcrunch

Meta warned it faces 'heavy sanctions' in EU if it fails to fix child protection issues on Instagram
The European Union has fired a blunt warning at Meta, saying it must quickly clean up its act on child protection or face the risk of “heavy sanctions”. The warning follows a report by the Wall Street...

Hoje, às 16:03

DEV

Taking Control with PostgreSQL Functions: Closing the Gap to ORM Functionality
Unveiling the Disparity: Understanding the Divide Between Direct Driver and ORM Functionality When it comes to choosing the technologies for developing a backend and manipulating data in a database like...

Hoje, às 16:02