Microsoft дала ИИ настоящий инструмент программиста — и он впервые узнал, как сложно быть человеком

Support81

Модератор
Инструмент debug-gym удваивает успех моделей, но до человека ещё далеко.
mai.jpg


Искусственный интеллект активно внедряется в сферу разработки программного обеспечения, и вряд ли найдётся другая область, где его используют столь широко. От генерации кода по описанию в духе «настроения» до GitHub Copilot и стартапов, которые собирают простенькие приложения за считанные часы при поддержке больших языковых моделей — ИИ уже стал неотъемлемой частью инструментов программиста.

Тем не менее, те, кто рассчитывает, что через пару месяцев ИИ вытеснит большинство разработчиков, сильно переоценивают возможности современных моделей. Главная причина — они по-прежнему плохо справляются с отладкой, а именно на неё уходит большая часть времени любого разработчика. Об этом говорится в исследовании Microsoft Research, где представили новый инструмент debug-gym — платформу для тестирования и улучшения навыков ИИ в поиске и устранении ошибок в коде.

Debug-gym — это среда, в которой ИИ-модели могут работать с реальными репозиториями, используя привычные для программистов инструменты: ставить точки останова, просматривать значения переменных, писать тесты, переходить по коду и так далее. Всё это позволяет моделям не просто «угадывать» исправления на основе изученных ранее шаблонов, а опираться на реальное выполнение программы и логику конкретного проекта. Microsoft отмечает, что без таких средств ИИ-модели в отладке проявляют себя довольно слабо. С ними — ощутимо лучше, но всё равно далеко от уровня опытного разработчика.

В тестах debug-gym модели, получившие доступ к инструментам, показали почти вдвое более высокие показатели успешной отладки по сравнению с теми, кто работал «вслепую». Но даже в лучшем случае модели смогли успешно завершить задание лишь в 48,4% случаев. Это значительный прогресс, но пока явно недостаточный, чтобы заменить человека.

Microsoft объясняет ограничения тем, что текущие языковые модели обучались на данных, в которых мало представлено поведение, характерное для отладки — например, последовательные действия по поиску ошибки. Это делает область особенно перспективной для дальнейших исследований. В следующем этапе планируется обучение специальной модели, заточенной именно под поиск информации, необходимой для устранения багов. Такая «поисковая» модель может помогать более крупной системе, снижая расходы на вычисления.



Скепсис в отношении полной замены программистов ИИ не нов. Уже есть немало исследований, показывающих, что даже если модель способна собрать простое приложение, её код часто содержит баги и уязвимости, которые она не в состоянии исправить. Так что текущий путь скорее ведёт не к полной автономии ИИ, а к созданию эффективного помощника, способного экономить разработчику время, но не заменять его полностью.
Подробнее: https://www.securitylab.ru/news/558291.php
 
Похожие темы
D 150k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
D 489.6k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
D 49.5k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
Support81 Новая тактика «Призрачных звонков» использует Zoom и Microsoft Teams для операций C2 Новости в сети 0
Support81 Вирус-вымогатель Akira использует инструмент настройки процессора, чтобы отключить Microsoft Defender Новости в сети 0
ValidMail ♋ 14kk MICROSOFT DOMAIN WITH VALID 05/08/25 ♋ Раздачи и сливы 0
ValidMail ♋ 1.2 MILLION MICROSOFT DOMAIN (HAVE VALID) 30/07/25 ♋ Раздачи и сливы 0
Support81 Microsoft снова сыграла на руку хакерам — корпоративные сети ломают через официальный софт Новости в сети 0
ValidMail ♋ 32k MICROSOFT DOMAINS WITH VALID 21.05.25 ♋ Раздачи и сливы 0
Support81 Плати или рискуй: Microsoft будет брать плату за обновления Windows Новости в сети 0
BinaryCloud (62.263 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (101.200 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (78.231 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (73.764 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (58.262 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (93.164 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (89.879 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (117.025 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (69.533 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (63.984 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (109.903 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (117.840 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (94.664 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (102.339 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
Support81 Разработчики игр восстали против нового игрового инструмента искусственного интеллекта от Microsoft Новости в сети 0
Support81 Storm-2372: конференции в Microsoft 365 стали инструментом кражи гостайны Новости в сети 0
Support81 Банды программ-вымогателей выдают себя за ИТ-поддержку в фишинговых атаках на Microsoft Teams Новости в сети 0
Support81 BadRAM: как взломать облака Amazon, Google и Microsoft за $10 Новости в сети 0
Support81 Microsoft сокрушила фишинг-империю: уничтожено 240 сайтов MRxC0DER Новости в сети 0
ValidMail ♋ 54k MICROSOFT DOMAINS WITH VALID 01.11.24 ♋ Раздачи и сливы 0
Support81 Sway и QR-коды: опасный фишинговый тандем, нацеленный на сервисы Microsoft 365 Новости в сети 0
Support81 CloudSorcerer: хакеры шпионят за российскими чиновниками через Microsoft Graph, Yandex Cloud и Dropbox Новости в сети 0
Support81 Роaring Kitty – легенда или аферист: Microsoft India втянута в мошенническую схему Новости в сети 0
Support81 Функция Recall от Microsoft — шаг к тотальному наблюдению? Новости в сети 0
Support81 Amazon, Google и Microsoft открыты для хакеров: ошибка Fluent Bit дает доступ к данным Новости в сети 0
Emilio_Gaviriya Защита и надёжность: Важность патчей для Microsoft Active Directory. Вирусология 0
Support81 Не только умный, но и опасный: темная сторона ИИ от Microsoft Новости в сети 0
Support81 Уязвимость Microsoft Office становится временной бомбой в руках киберпреступников Новости в сети 0
Support81 Пользователи Microsoft 365 рискуют потерять аккаунт: не спасёт даже МФА Новости в сети 0
Support81 Вот это поворот: Microsoft Defender стал помечать Tor Browser как вредоносное ПО Новости в сети 2
Support81 Похитители cookie: Microsoft предупреждает о росте числа атак «человек посередине» с обходом MFA Новости в сети 0
Support81 Киберпреступники активно подделывают системы авторизации Microsoft и Adobe Новости в сети 0
phantom_gift AMAZON & MICROSOFT & PAYPAL - Отработаю ваши логи Ищу работу. Предлагаю свои услуги. 1
K kamisama refund service | Amazon 15% | Logitech | Microsoft | Ищу работу. Предлагаю свои услуги. 1
Denik Интересно Хакерская группировка АРТ31 впервые атаковала российские компании Microsoft обвиняла ее в атаке на участников выборов президнта США 2020 года Новости в сети 0
J Аккаунт microsoft azure 200$ balance Доступы: RDP, VPS, SQL inj, базы, сайты, shell's 0
Denik Интересно Эксперты Microsoft нашли критические баги в роутерах Netgear Новости в сети 0
E Microsoft Defender ATP принял обновление для Chrome за троянское ПО Новости в сети 1
Р Получаем Дедик microsoft Раздачи и сливы 1
АнАлЬнАя ЧуПаКаБрА Microsoft.com Reg Checker || XAPIC Готовый софт 2

Название темы