Seu primeiro mordomo robô precisará de olhos humanos

Crédito: Japan Times – 02/06/2023 -Sexta

Não sei se você ouviu, mas os robôs estão chegando.

A Tesla Inc. tem uma com polegares opositores chamada Optimus, e outras startups como a Figure, com sede na Califórnia, e a 1X, da Noruega, estão construindo máquinas ambulantes com torsos e braços que podem empilhar mercadorias em armazéns. Mas, para serem realmente úteis em seus primeiros anos de trabalho, muitos desses robôs precisarão ser dirigidos por humanos, representando um desafio único em relação à privacidade e ao marketing para seus fabricantes.

Pegue o Alfie. É o protótipo da startup londrina Prosper Robotics e parece um personagem do Minecraft tornado real: um pouco mais alto que um homem adulto, volumoso e deslizando lentamente sobre rodas. Também é dirigido por uma equipe de jogadores nas Filipinas, que usam fones de ouvido de realidade virtual ao longo do dia para controlar seus movimentos.

No escritório de Prosper, as máquinas zumbem ao fundo de seu depósito bem iluminado repleto de placas de circuito impresso, fios e gavetas de plástico. Cinco grandes robôs em cores vivas movem-se lentamente pela sala, alguns manipulando objetos como parte de seu treinamento ou passando por “pistas de obstáculos” em uma cozinha simulada. Um robô laranja na parte de trás pega uma garrafa de suco vazia e a joga repetidamente em uma lata de lixo. Outro bot amarelo está mexendo em uma caixa plástica de Tupperware.

Faça essas coisas várias vezes e os robôs aprenderão a abrir uma caixa ou dobrar uma toalha. O paradoxo da IA é que, embora possa escrever ensaios semelhantes aos humanos, as máquinas ainda mal conseguem andar ou pegar uma xícara. Por que? Porque, embora os modelos que alimentam o ChatGPT tenham sido treinados em bilhões de palavras na Internet pública, não há dados semelhantes para ajudá-los a copiar nossos movimentos biomecânicos.

Então aquele robô laranja está realmente se virando para mim para acenar? Um teleoperador humano está fazendo esse trabalho. Há cerca de seis desses operadores trabalhando em turnos em um pequeno escritório em Dumaguete, nas Filipinas. Em qualquer dia, um operador ou “piloto” usará um fone de ouvido de realidade virtual Quest 2, fabricado pela Meta Platforms Inc., movendo os braços e usando os controladores do Quest para pegar as coisas.

Dirigir um robô dessa maneira é muito mais intuitivo do que usar um teclado. Quando o operador levanta o braço, o braço do robô sobe. Quando eles viram a cabeça para a esquerda, uma câmera na cabeça de Alfie olha para a esquerda. A equipe é formada principalmente por jogadores que foram contratados por suas habilidades em jogos de tiro em primeira pessoa e jogos de estratégia como Counterstrike. Agora, em vez de disparar armas, eles estão fazendo camas. Mas de alguma forma, pelo menos por enquanto, ainda parece um jogo.

“É divertido”, diz Lienelson Mark Pardo Samosa, que dirige o time nas Filipinas e é um habilidoso jogador de Call of Duty. “Prefiro escolher usar o fone de ouvido e lavar a roupa do que lavar a roupa em casa.” Na primeira sessão, ele colocou um fone de ouvido, com os olhos lacrimejando pelo uso excessivo. Agora Samosa pisca com frequência e inclina a cabeça para trás para evitar forçar. Às vezes, ele usa o fone de ouvido por várias horas seguidas.

Mas na maioria das vezes ele gosta do trabalho. Ele e seus colegas de trabalho costumam passar os turnos brincando e conversando, o que pode parecer incongruente com a sensação de estar em outro país. “É como trazer seus colegas para Londres”, diz Samosa, 37.

Para a pessoa do outro lado do mundo que está limpando a casa, a dinâmica humano-robô também é difícil de entender. Lukas Kobis, um empreendedor iniciante local, tinha um robô Alfie em seu apartamento em Londres entre fevereiro e março deste ano. Ele se lembra de ter ficado inseguro no início sobre ter uma pessoa dirigindo o carro em sua casa, mesmo quando ele estava trabalhando. Mas eventualmente ele não se importou nem um pouco. Na verdade, em alguns momentos, ele parecia esquecer que uma pessoa estava envolvida.

“Foi legal quando ele acenou para mim quando voltei para casa”, lembra Kobis. “Eu sei que alguém o estava controlando, mas parecia que eu estava dizendo ‘oi’ para o meu robô.”

Alfie ficava a maior parte do tempo na cozinha e na sala de estar de Kobis, esfregando o chão, limpando superfícies e carregando a máquina de lavar louça, até mesmo usando suas pinças de borracha para colocar pequenas pastilhas de detergente na máquina. Uma gama tão ampla de tarefas seria extremamente difícil para um robô autônomo realizar adequadamente, mas Alfie pode realizá-las com poucos problemas graças a seus operadores humanos.

O fundador da Prosper Robotics, Shariq Hashme, admite que pode ser um desafio convencer as pessoas a permitir que robôs conduzidos por humanos entrem em suas casas, mas ele aponta que seus teleoperadores não serão capazes de ler texto ou ver o rosto das pessoas porque eles ficarão desfocados e os clientes pode dizer “congelar” para fazer Alfie ficar parado.

Hashme, que anteriormente fazia pesquisas na OpenAI, fez o robô trabalhar em sua casa por cerca de duas semanas, limpando e arrumando a cama quando estava trabalhando. “Em teoria, ele iria preparar o café da manhã para mim todas as manhãs”, diz ele. “Nunca chegamos a isso.”

Os consumidores parecem estar se acostumando lentamente a “escutar” máquinas como Alexa e Google Assistant em suas casas, embora milhares de humanos sejam conhecidos por monitorar seu uso para melhorar os dispositivos.

Isso pode dar licença a Hashme para se concentrar mais em garantir que seus teleoperadores estejam confortáveis. Mesmo antes do ciclo de hype mais recente desencadeado pelo ChatGPT da OpenAI, as startups de IA eram notórias entre os investidores de capital de risco por exagerar as capacidades de sua tecnologia e até mesmo usar humanos para fazer trabalhos que os algoritmos não podiam fazer, mantendo essas pessoas em segredo.

Alguns dos sistemas de IA mais sofisticados que usamos hoje, incluindo o ChatGPT, também foram treinados por rotuladoras em países em desenvolvimento, muitas vezes com pouco ou nenhum crédito e às vezes com práticas de exploração. Uma abordagem melhor é destacar o trabalho desses rotuladores e pagá-los bem. Samosa diz que ele e sua equipe nas Filipinas estão satisfeitos com o salário. E trabalhar remotamente para alguém em Londres significa que eles não precisam deixar suas famílias, acrescenta.

Hashme diz que, com o tempo, seus operadores serão capazes de dirigir várias máquinas ao mesmo tempo, assim como os robôs de entrega de hoje que passam zunindo pelas calçadas de alguns bairros. “Um operador pode controlar 10 desses robôs e receber mais, porque o trabalho vale mais”, diz Hashme.

Posicionar os robôs como liderados por pessoas pode deixar alguns consumidores desconfortáveis, mas provavelmente é a única maneira de reunir os dados de treinamento necessários para tornar esses dispositivos totalmente autônomos no futuro. Os consumidores podem até acreditar mais em máquinas com pessoas ao volante do que em algo automatizado e desajeitado.

Hashme estima que precisaria coletar dados de 10.000 a 100.000 robôs, inicialmente dirigidos por humanos, para treiná-los a um ponto em que pudessem trabalhar de forma autônoma. E, mesmo no futuro, “você sempre precisará de uma pessoa com vista para, digamos, 100.000 robôs”, diz ele.

Aqui em Londres, as pessoas ainda assistem a um programa de ficção científica de longa duração chamado “Dr. Who”, cujos Daleks vilões parecem potes de pimenta gigantes e rolam com um único olho e uma voz robótica assustadora. Pode haver algo um pouco menos assustador em ter humanos atrás de “autômatos” de tamanho semelhante. Pode não ser do gosto da maioria das pessoas, mas é um começo.

Foto: Japan Times (O paradoxo da IA é que, embora possa escrever ensaios semelhantes aos humanos, as máquinas ainda mal conseguem andar ou pegar uma xícara. | GETTY IMAGES)

Post Views: 349