“Inteligência Artificial” (AI) tem sido, definitivamente, um dos termos mais utilizadas em 2023 no mundo corporativo. Mas, como tudo que é novo e “tecnológico”, é cheio de confete e purpurina e poucas pessoas entendem bem do que se trata.
Uma boa definição, da gigante de armazenamento de dados NetApp: “A inteligência artificial (IA) é a base para imitar os processos de inteligência humana por meio da criação e aplicação de algoritmos integrados a um ambiente de computação dinâmico. Simplificando, a IA está tentando fazer os computadores pensarem e agirem como humanos. Atingir esse objetivo requer três componentes principais: (1) Sistemas computacionais, (2) Dados e gerenciamento de dados, e (3) Algoritmos avançados de IA (código). Quanto mais humanizado for o resultado desejado, mais dados e poder de processamento serão necessários.”
Crítica social foda (via ml.india)
Veja bem: é fazer os computadores “pensarem e agirem como humanos”, não é só necessário um bando de pessoas trabalhando em algoritmos e códigos de programação e um sistema que suporte o fluxo de informação, mas também dados. É daí que vem grande parte da contagem comparativa do grande número de plataformas de AI que vêm surgindo.
Um Conhecido Entre Nós
Por isso mesmo, logo depois do boom de uso do ChatGPT – um grande modelo de linguagem que foi treinado em um conjunto de dados de aproximadamente 8 milhões de páginas da web, conhecido como conjunto de dados "WebText", bem como várias outras fontes de texto, incluindo livros, artigos e outros trabalhos escritos – , veio a “nossa” Bloomberg velha de guerra há cerca de um mês atrás anunciar uma AI pra chamar de sua, a BloombergGPT. Nesse ínterim, ainda tivemos o Google e seu Bard e a Microsoft e seu Azure.
A Bloomberg (BBG) tem suas vantagens: são mais de 40 anos de base de dados de uma quantidade enorme de variáveis, o que resultou em extenso arquivo de dados financeiros para criar um conjunto de dados abrangente de 363 bilhões de tokens, composto por documentos financeiros em inglês Esses dados foram aumentados, segundo a empresa, com um conjunto de dados públicos de 345 bilhões de tokens para criar um grande corpus de treinamento com mais de 700 bilhões de tokens.
Usando uma parte desse corpus de treinamento, a equipe de tecnologia da BBG treinou um modelo de linguagem causal de decodificador de 50 bilhões de parâmetros. O modelo resultante foi validado em benchmarks de NLP específicos para finanças existentes, um conjunto de benchmarks internos da Bloomberg e amplas categorias de tarefas de NLP de propósito geral de benchmarks populares. Segundo estudos da própria BBG, a performance de sua AI é muito superior a quase todas as existentes:
Quanto maior o valor, maior o “poder explicativo” da AI (Fonte: Bloomberg)
“A qualidade dos modelos de aprendizado de máquina e PNL se resume aos dados que você coloca neles”, explica o time da Bloomberg. “Graças à coleção de documentos financeiros que a Bloomberg organizou ao longo de quatro décadas, fomos capazes de criar cuidadosamente um conjunto de dados específico de domínio grande e limpo para treinar um LLM [large language models] mais adequado para casos de uso financeiro.”
Briga de Facão
E, como apontado pelos chefões da BBG, dados são um insumo essencial na produção de uma boa AI, por isso mesmo uma briga pode abalar as estruturas das big techs logo menos: nessa semana, o CEO do Twitter, Elon Musk, acusou a Microsoft de “treinar” a sua AI, o Microsoft Azure, com os dados do Twitter. Isso, obviamente, é ilegal.
Como já apontamos anteriormente nessa encíclica, “dados são o petróleo do século XXI”, e a ameaça de Musk é a mostra como que a propriedade dos dados está rapidamente se tornando um campo de batalha intenso na corrida das AI. As grandes empresas de tecnologia estão trabalhando para desenvolver modelos de AI de ponta e os proprietários de dados estão tentando interrompê-los ou cobrar pelo uso de seu conteúdo. A Microsoft desenvolve seus próprios large language models (LLMs) e vende acesso aos modelos da OpenAI.
Só pra ter uma ideia: a Microsoft investiu US$10 bilhões na OpenAI no ano passado. OpenAI da qual Elon Musk foi cofundador antes de deixar seu conselho em 2018. Recentemente, Musk recentemente da mudança da empresa de um modelo sem fins lucrativos para um negócio altamente valioso influenciado pela Microsoft. Mais um bicada entre Musk e a empresa de Bill Gates.
À medida que esses novos modelos de IA passam de laboratórios de pesquisa e universidades para o mundo corporativo, os proprietários dos dados começam a fazer exigências. E, com isso, essa história de inteligência artificial passa de um episódio de Big Bang Theory, onde nerds discutem sobre matemática e teorias difíceis, para um episódio de Suits, onde bilionários enfrentam uma batalha acirrada por market share e pelos melhores insumos.
Os Outros Elementos
Dados são um input essencial, mas nos elementos essenciais a uma boa AI também foi elencado, no início dessa carta, o gerenciamento de dados. O grande fluxo de informação, além do problema da velocidade na transmissão de dados, também requer mecanismos de segurança e verificação das informações transmitidas.
Nesse sentido, uma das tecnologias que mais adotadas pelas empresas é blockchain, um mecanismo de banco de dados avançado que permite compartilhar informações na rede de uma empresa. Nas palavras da Amazon, “um banco de dados blockchain armazena dados em blocos interligados em uma cadeia, e os dados são cronologicamente consistentes porque não é possível excluir nem modificar a cadeia sem o consenso da rede. Como resultado, você pode usar a tecnologia blockchain para criar um ledger inalterável ou imutável para monitorar pedidos, pagamentos, contas e outras transações. O sistema tem mecanismos integrados que impedem entradas de transações não autorizadas e criam consistência na visualização compartilhada dessas transações.”
Nossos parceiros da Foxbit fornecem soluções B2B em blockchain para que sua empresa se adapte ao novo ambiente de negócios digital. A Foxbit, uma das maiores exchanges de criptos do mundo e nossa parceira de longa data, oferece serviços B2B para a economia 3.0, levando ao mercado soluções que vão desde gateway de pagamento, tokenização de ativos e a solução cripto-as-a-service, para que qualquer instituição ofereça negociação de criptomoedas diretamente de suas aplicações e disponha dos serviços de blockchain, uma tecnologia vista como mais segura do que muitos serviços tradicionais. Conheça mais no site da Foxbit.
O Futuro
A qualquer nova tecnologia que surge, o primeiro buzz é como o trabalho humano será substituído. O ChatGPT vai fazer o trabalho escolar das crianças? A BloombergGPT vai substituir um exército de analistas bem pagos e que só acertam as vezes suas projeções? Responder a essas perguntas são exercícios de futurologia e, como tal, sujeitas grandes erros de projeção.
Mas um exercício interessante foi feito por pesquisadores do banco central americano na divisão de Richmond: o trabalho de Anne Hansen e Sophia Kazinnik investiga a capacidade dos modelos Generative Pre-training Transformer (GPT) de decifrar o “Fedspeak”, um termo usado para descrever a linguagem técnica usada pelo Federal Reserve para se comunicar sobre decisões de política monetária. Foi avaliada a capacidade dos modelos GPT de classificar a postura política dos anúncios do Federal Open Market Committee (FOMC) em relação a um benchmark humano classificado. O resultado? O desempenho dos modelos GPT supera o de outros métodos de classificação populares.
E o que esperar dessa miríade de ferramentas de AI que estão surgindo? Bem, aparentemente, estamos apenas no início do que parece ser a nova corrida à Lua, em que as grandes e pequenas empresas de tecnologia procuram um algoritmo de AI que seja o mais fidedigno possível ao modo de pensar de um ser humano. Se uma vamos conseguir emular 6 milhões de evolução humana? É possível que não. E, talvez, nem seja isso que os desenvolvedores dessas ferramentas desejam… Fiquemos de olho.
Frase da semana
Nada é tão permanente quanto um programa temporário do governo.
Milton Friedman
Economia e mercados
Semana começou com tom positivo ainda, por conta do humor com a temporada de resultados, mas as empresas tech acabaram jogando um pouco de Chopp no humor do mercado. No lado macro, nada de novo aconteceu e o diagnóstico é de economia forte e que precisa de uma dose adicional de juros para esfriar. Os membros do Fed estão em silêncio agora e so voltam em maio. Até lá seguimos o observando a crise bancária e os resultados das empresas
China começou a semana com um tom superpositivo, com forte aceleração no primeiro trimestre e deixando um gosto doce na boca de quem esperava uma reabertura forte. É bom não confundir isso com um real estate forte. Vai demorar um pouco até normalizar, ainda assim os ventos de China seguem bem favoráveis.
Já o Brasil deu uma embrazada. O arcabouço fiscal veio basicamente com um tapinha na banda caso o governo não cumpra a meta de primário. Não tem nenhuma grande punição, o que faz diferença em um ano eleitoral, por exemplo. A narrativa de que o arcabouço tirou o evento de calda dura por um tempo, mas não o tempo todo.
Trocaram quem escrevia as cartas? Eram melhores, senti falta do humor que as cartas do condado traziam.
Boa !