Baidu wzmacnia ofertę AI z generatorem tekstu do obrazu, bez kodu konstruktora aplikacji

Chiński Koncern Baidu Inc zaprezentował we wtorek (12.11) szereg nowych aplikacji do technologii sztucznej inteligencji, w tym generator tekstu do obrazu i narzędzie, które umożliwia użytkownikom tworzenie aplikacji bez kodowania wiedzy specjalistycznej. Wiodący dostawca wyszukiwarek w kraju należy do firm technologicznych, które skupiają się na komercjalizacji aplikacji Model Large Language po prawie dwóch latach dużych inwestycji w badania i rozwój w modelach, które reklamują jako alternatywy dla GPT Openai.

Na corocznej konferencji Baidu World CEO Robin Li wprowadził I-RAG, technologię tekstu do obrazu, która wykorzystuje możliwości wyszukiwania Baidu w celu rozwiązania problemu „halucynowania AI”, odnosząc się do generowania obrazów, które odbiegają od tekstu wejściowego lub nie zawierają teksu w ogóle. Li informuje, że platforma Ernie przerabia obecnie 1,5 miliarda pytań i interakcji dziennie, co stanowi znaczny wzrost w porównaniu z 200 milionami dziennych wniosków ogłoszonymi w maju tego roku.
Interakcje te obejmują zadania, takie jak generowanie tekstu, odpowiadanie na pytania i pomoc w różnych aplikacjach przy użyciu sztucznej inteligencji.

Wysiłki komercjalizacyjne Baidu w dużej mierze obracały się wokół jego agentów AI, co pozwala użytkownikom tworzyć własne aplikacje. Firma zintegrowała również technologię z istniejącą ofertą produktów i oferując ją użytkownikom zewnętrznym za pośrednictwem swoich usług w chmurze.

Baidu zaprezentował także parę okularów z wbudowanym asystentem AI, opracowanym przez IT Division, Xiaodu. Gadżet jest wyposażony w kamery do robienia zdjęć i filmów oraz obsługuje interakcje głosowe napędzane przez Ernie. – Firma nie dąży do stworzenia „super aplikacji” opartej na sztucznej inteligencji – wyjaśnia Li, sygnalizując rozbieżność strategii innych firm, takich jak Bytedance, która w tym roku uruchomiła wiele samodzielnych aplikacji AI.

Baidu wprowadził także Miaoda, która wykorzystuje swoje możliwości LLM do generowania kodu, umożliwiając użytkownikom opracowywanie aplikacji bez obszernej wiedzy specjalistycznej kodowania.