Quais são as consequências do DeepSeek e quais são as possibilidades que ele oferece em comparação com a versão capitalista da IA
A maioria dos leitores já deve saber das novidades. A DeepSeek, uma empresa chinesa de IA, lançou um modelo de IA chamado R1 que é comparável em capacidade aos melhores modelos de empresas como OpenAI, Anthropic e Meta, mas foi treinado a um custo radicalmente menor e usando menos chips de GPU de última geração. A DeepSeek também tornou públicos os detalhes do modelo o suficiente para que outros possam executá-lo em seus próprios computadores sem custos.
DeepSeek é um torpedo que atingiu as Magnificent Seven empresas de alta tecnologia dos EUA abaixo da linha d’água. DeepSeek não usou os chips e software mais recentes e melhores da Nvidia; não exigiu grandes gastos no treinamento de seu modelo de IA, diferentemente de seus rivais americanos; e oferece tantas aplicações úteis quanto.
A DeepSeek construiu seu R1 com chips mais antigos e lentos da Nvidia, que as sanções dos EUA permitiram que fossem exportados para a China.
O governo dos EUA e os titãs da tecnologia achavam que tinham o monopólio no desenvolvimento de IA por causa dos enormes custos envolvidos na fabricação de melhores chips e modelos de IA. Mas agora o R1 da DeepSeek sugere que empresas com menos dinheiro podem em breve operar modelos de IA competitivos. O R1 pode ser usado com um orçamento apertado e com muito menos poder de computação. Além disso, o R1 é tão bom quanto os rivais em “inferência”, o jargão de IA para quando os usuários questionam o modelo e obtêm respostas. E ele roda em servidores para todos os tipos de empresas para que elas não precisem “alugar” a preços enormes de empresas como a OpenAI.
Mais importante, o R1 da DeepSeek é ‘open source’, ou seja, os métodos de codificação e treinamento são abertos para todos copiarem e desenvolverem. Este é um verdadeiro golpe para os segredos ‘proprietários’ que a OpenAI ou a Gemini da Google trancam em uma ‘caixa preta’ para maximizar os lucros. A analogia aqui é com produtos farmacêuticos de marca e genéricos.
O grande problema para as empresas de IA dos EUA e seus investidores é que parece que construir enormes data centers para abrigar múltiplos chips caros pode não ser necessário para atingir resultados suficientemente bem-sucedidos. Até agora, as empresas dos EUA têm aumentado enormes planos de gastos e tentado levantar mega quantias de financiamento para isso. De fato, na mesma segunda-feira em que o R1 da DeepSeek chegou às notícias, a Meta anunciou outros US$ 65 bilhões em investimento, e apenas alguns dias antes o presidente Trump anunciou subsídios governamentais de US$ 500 bilhões para os gigantes da tecnologia como parte do chamado projeto Stargate. Ironicamente, o presidente-executivo da Meta, Mark Zuckerberg, disse que estava investindo porque “Queremos que os EUA estabeleçam o padrão global de IA, não a China”. Oh, céus.
Agora, os investidores estão preocupados que esse gasto seja desnecessário e, mais importante, que isso afete a lucratividade das empresas americanas se a DeepSeek puder entregar aplicativos de IA a um décimo do custo. Cinco das maiores ações de tecnologia voltadas para IA — a fabricante de chips Nvidia e as chamadas ‘hyperscalers’ Alphabet, Amazon, Microsoft e Meta Platforms — perderam coletivamente quase US$ 750 bilhões do valor de mercado de ações em um dia. E a DeepSeek ameaça os lucros das empresas de data center e das operadoras de água e energia que esperam se beneficiar do enorme ‘aumento de escala’ das Magnificent Seven. O boom do mercado de ações dos EUA está fortemente concentrado nas ‘Magnificent Seven’.
Então, o DeepSeek perfurou a enorme bolha do mercado de ações em ações de tecnologia dos EUA? O investidor bilionário Ray Dalio acha que sim. Ele disse ao Financial Times que “os preços chegaram a níveis altos ao mesmo tempo em que há um risco de taxa de juros, e essa combinação pode furar a bolha… Onde estamos no ciclo agora é muito semelhante a onde estávamos entre 1998 ou 1999”, disse Dalio. “Em outras palavras, há uma nova tecnologia importante que certamente mudará o mundo e será bem-sucedida. Mas algumas pessoas estão confundindo isso com os investimentos sendo bem-sucedidos.”
Mas esse pode não ser o caso, pelo menos não ainda. O preço das ações da empresa de chips de IA Nvidia pode ter despencado esta semana, mas sua linguagem de codificação “proprietária”, Cuda, ainda é o padrão da indústria dos EUA. Embora suas ações tenham caído quase 17%, isso só as traz de volta ao nível (muito, muito alto) de setembro.
O que deve enfurecer os oligarcas da tecnologia bajulando Trump é que as sanções dos EUA a empresas chinesas e as proibições de exportações de chips não impediram a China de fazer ainda mais avanços na guerra de tecnologia e chips com os EUA. A China está conseguindo dar saltos tecnológicos em IA, apesar dos controles de exportação introduzidos pelo governo Biden, com a intenção de privá-la tanto dos chips mais poderosos quanto das ferramentas avançadas necessárias para fazê-los.
A campeã tecnológica chinesa Huawei surgiu como a principal concorrente da Nvidia na China para chips de “inferência”. E tem trabalhado com empresas de IA, incluindo a DeepSeek, para adaptar modelos treinados em GPUs Nvidia para executar inferência em seus chips Ascend. ” A Huawei está melhorando. Eles têm uma abertura, pois o governo está dizendo às grandes empresas de tecnologia que elas precisam comprar seus chips e usá-los para inferência”, disse um investidor em semicondutores em Pequim.
Esta é mais uma demonstração de que o investimento planejado liderado pelo estado em tecnologia e habilidades tecnológicas pela China funciona muito melhor do que depender de gigantes tecnológicos privados liderados por magnatas. Como Ray Dallo disse: “Em nosso sistema, em geral, estamos nos movendo para um tipo de política mais complexo-industrial em que haverá atividade governamental mandatada e influenciada pelo governo, porque é tão importante… O capitalismo sozinho — o motivo do lucro sozinho — não pode vencer esta batalha.”
No entanto, os titãs da IA ainda não são os titânicos. Eles estão indo em frente com o “escalamento” investindo ainda mais e mais bilhões em data centers e chips mais avançados. Isso está consumindo poder de computação exponencialmente.
E, claro, não há consideração sobre o que os economistas tradicionais educadamente gostam de chamar de “externalidades”. De acordo com um relatório do Goldman Sachs, uma consulta do ChatGPT precisa de quase 10 vezes mais eletricidade do que uma consulta de pesquisa do Google. O pesquisador Jesse Dodge fez algumas contas de guardanapo sobre a quantidade de energia que os chatbots de IA usam.
“Uma consulta ao ChatGPT usa aproximadamente tanta eletricidade quanto acenderia uma lâmpada por cerca de 20 minutos”, ele diz. “Então, você pode imaginar que com milhões de pessoas usando algo assim todos os dias, isso soma uma quantidade realmente grande de eletricidade.”
Mais consumo de eletricidade significa mais produção de energia e, em particular, mais emissões de gases de efeito estufa provenientes de combustíveis fósseis.
O Google tem a meta de atingir emissões líquidas zero até 2030. Desde 2007, a empresa diz que suas operações são neutras em carbono por causa das compensações de carbono que compra para corresponder às suas emissões. Mas, a partir de 2023, o Google escreveu em seu relatório de sustentabilidade que não estava mais “mantendo a neutralidade operacional de carbono”. A empresa diz que ainda está pressionando por sua meta líquida zero em 2030.
“A real motivação do Google aqui é construir os melhores sistemas de IA que eles puderem”, diz Dodge. “E eles estão dispostos a investir uma tonelada de recursos nisso, incluindo coisas como treinar sistemas de IA em data centers cada vez maiores até supercomputadores, o que incorre em uma tremenda quantidade de consumo de eletricidade e, portanto, em emissões de CO2.”
Depois, há a água. Enquanto os EUA enfrentam secas e incêndios florestais, as empresas de IA estão sugando água profunda para “resfriar” seus mega data centers para proteger os chips . Mais do que isso, as empresas do Vale do Silício estão cada vez mais assumindo o controle da infraestrutura de fornecimento de água para atender às suas necessidades. Pesquisas sugerem, por exemplo, que cerca de 700.000 litros de água poderiam ter sido usados para resfriar as máquinas que treinaram o ChatGPT-3 nas instalações de dados da Microsoft.
O treinamento de modelos de IA consome 6.000 vezes mais energia do que uma cidade europeia. Além disso, embora minerais como lítio e cobalto sejam mais comumente associados a baterias no setor automotivo, eles também são cruciais para as baterias usadas em data centers. O processo de extração geralmente envolve uso significativo de água e pode levar à poluição, prejudicando a segurança hídrica.
Sam Altman, o antigo herói sem fins lucrativos da Open AI, mas agora empenhado em maximizar os lucros da Microsoft, argumenta que sim, infelizmente há “compensações” no curto prazo, mas elas são necessárias para atingir a chamada AGI; e a AGI nos ajudará a resolver todos esses problemas, então a compensação de “externalidades” vale a pena.
AGI? O que é isso? A inteligência artificial generalizada (AGI) é o Santo Graal dos desenvolvedores de IA. Isso significa que os modelos de IA se tornariam “superinteligentes” muito acima da inteligência humana. Quando isso for alcançado, Altman promete, sua IA não será capaz de fazer apenas o trabalho de um único trabalhador, ela será capaz de fazer todos os seus trabalhos: “A IA pode fazer o trabalho de uma organização”. Isso seria o máximo em maximizar a lucratividade ao acabar com os trabalhadores nas empresas (mesmo as empresas de IA?) à medida que as máquinas de IA assumem a operação, o desenvolvimento e o marketing de tudo. Este é o sonho apocalíptico para o capital (mas um pesadelo para o trabalho: sem emprego, sem renda).
É por isso que Altman e os outros magnatas da IA não vão parar de expandir seus data centers e desenvolver chips ainda mais avançados só porque a DeepSeek prejudicou seus modelos atuais. A empresa de pesquisa Rosenblatt previu a resposta dos gigantes da tecnologia: “Em geral, esperamos que o viés seja na capacidade aprimorada, correndo mais rápido em direção à inteligência artificial geral, mais do que na redução de gastos.” Nada deve impedir o objetivo da IA superinteligente.
Alguns veem a corrida para atingir a AGI como uma ameaça à própria humanidade. Stuart Russell, professor de ciência da computação na Universidade da Califórnia, Berkeley, disse: “Até mesmo os CEOs que estão se engajando na corrida declararam que quem vencer tem uma probabilidade significativa de causar a extinção humana no processo, porque não temos ideia de como controlar sistemas mais inteligentes do que nós”, disse ele. “Em outras palavras, a corrida da AGI é uma corrida em direção à beira de um precipício.”
Talvez, mas continuo a duvidar que a ‘inteligência’ humana possa ser substituída pela inteligência da máquina, principalmente porque elas são diferentes. As máquinas não conseguem pensar em mudanças potenciais e qualitativas. O novo conhecimento vem de tais transformações (humanas), não da extensão do conhecimento existente (máquinas). Somente a inteligência humana é social e pode ver o potencial para a mudança, em particular a mudança social, que leva a uma vida melhor para a humanidade e a natureza.
O que o surgimento do DeepSeek mostrou é que a IA pode ser desenvolvida a um nível que pode ajudar a humanidade e suas necessidades sociais. É gratuita, aberta e disponível para o menor usuário e desenvolvedor. Não foi desenvolvida com fins lucrativos ou para gerar lucro. Como disse um comentarista:
“Eu quero que a IA lave minha roupa e louça para que eu possa fazer arte e escrever, não que a IA faça minha arte e escrever para que eu possa lavar roupa e lavar louça.” Os gerentes estão introduzindo a IA para “tornar os problemas de gerenciamento mais fáceis ao custo das coisas para as quais muitas pessoas acham que a IA não deve ser usada, como trabalho criativo… Se a IA vai funcionar, ela precisa vir de baixo para cima, ou a IA será inútil para a grande maioria das pessoas no local de trabalho”.
Em vez de desenvolver IA para gerar lucros, reduzir empregos e meios de subsistência de humanos, a IA sob propriedade e planejamento comuns poderia reduzir as horas de trabalho humano para todos e libertar os humanos do trabalho duro para se concentrarem no trabalho criativo que somente a inteligência humana pode entregar. Lembre-se de que o “Santo Graal” era uma ficção vitoriana e, mais tarde, também de Dan Brown.
Fonte: https://www.globalresearch.ca/ai-going-deepseek/5878642