09.10.2025
18:18
461
Браузерді адам секілді қолданатын ЖИ-модель пайда болды

Браузерді адам секілді қолданатын ЖИ-модель пайда болды

Google таныстырған жаңа жасанды интеллект моделі – Gemini 2.5 Computer Use – енді браузерде тірі адамдай әрекет ете алады. Ол тышқанмен басып, парақтарды айналдырып, мәтін тере отырып, бұрын API арқылы ғана орындалатын тапсырмаларды өздігінен атқарады, деп хабарлайды El.kz интернет порталы.

Жаңа жүйе визуалды тану мен логикалық талдау мүмкіндіктерін біріктіреді: ол қолданушының сұранысын «көзімен» шолып, жағдайды бағалайды да, нақты әрекет жасайды – мысалы, сайттағы форманы толтырып, жіберіп тастайды. Бұл әсіресе интерфейстерді тестілеу мен тікелей бағдарламалық қолжетімділігі жоқ сервистермен жұмыс істеуде таптырмас құрал.

Google бұл технологияны бұрын да тәжірибелік жобаларда сынаған. Мәселен, Project Mariner аясында ЖИ-агент рецепттегі ингредиенттер тізімін оқып, интернет-дүкендегі себетке қажетті өнімдерді өз бетімен қосқан.

Компания өкілдерінің айтуынша, Gemini 2.5 Computer Use веб және мобильді интерфейстерді тестілеу саласында бәсекелестерінен озық шыққан. ChatGPT Agent (OpenAI) және Claude (Anthropic) ұқсас функциялар ұсынғанымен, Google-дың жаңа моделі тек браузер деңгейінде жұмыс істейді. Қазір ол 13 негізгі әрекетті орындай алады: браузерді ашу, мәтін теру, элементтерді сүйреп апару және тағы басқа. Ал десктоп ортасымен толық жұмыс істеу функциясы әзірге жетілдіру үстінде.

Gemini 2.5-тің таныстырылымы OpenAI-дың ChatGPT үшін жаңа мини-қосымшалар жариялағанынан бір күн кейін өтті. Ал Anthropic өз «компьютерді басқару» технологиясын өткен жылы ұсынған болатын.

Қазіргі таңда әзірлеушілер Google AI Studio және Vertex AI арқылы Gemini 2.5 Computer Use мүмкіндіктерін сынай алады. Сондай-ақ Browserbase платформасында ашық демо-нұсқасы бар – ол жерде модельдің нақты уақыт режимінде түрлі тапсырмаларды қалай орындайтынын көруге болады.