Microsoft дала ИИ настоящий инструмент программиста — и он впервые узнал, как сложно быть человеком

Support81

Модератор
Инструмент debug-gym удваивает успех моделей, но до человека ещё далеко.
mai.jpg


Искусственный интеллект активно внедряется в сферу разработки программного обеспечения, и вряд ли найдётся другая область, где его используют столь широко. От генерации кода по описанию в духе «настроения» до GitHub Copilot и стартапов, которые собирают простенькие приложения за считанные часы при поддержке больших языковых моделей — ИИ уже стал неотъемлемой частью инструментов программиста.

Тем не менее, те, кто рассчитывает, что через пару месяцев ИИ вытеснит большинство разработчиков, сильно переоценивают возможности современных моделей. Главная причина — они по-прежнему плохо справляются с отладкой, а именно на неё уходит большая часть времени любого разработчика. Об этом говорится

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

Microsoft Research, где представили новый инструмент

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

— платформу для тестирования и улучшения навыков ИИ в поиске и устранении ошибок в коде.

Debug-gym — это среда, в которой ИИ-модели могут работать с реальными репозиториями, используя привычные для программистов инструменты: ставить точки останова, просматривать значения переменных, писать тесты, переходить по коду и так далее. Всё это позволяет моделям не просто «угадывать» исправления на основе изученных ранее шаблонов, а опираться на реальное выполнение программы и логику конкретного проекта. Microsoft отмечает, что без таких средств ИИ-модели в отладке проявляют себя довольно слабо. С ними — ощутимо лучше, но всё равно далеко от уровня опытного разработчика.

В тестах debug-gym модели, получившие доступ к инструментам, показали почти вдвое более высокие показатели успешной отладки по сравнению с теми, кто работал «вслепую». Но даже в лучшем случае модели смогли успешно завершить задание лишь в 48,4% случаев. Это значительный прогресс, но пока явно недостаточный, чтобы заменить человека.

Microsoft объясняет ограничения тем, что текущие языковые модели обучались на данных, в которых мало представлено поведение, характерное для отладки — например, последовательные действия по поиску ошибки. Это делает область особенно перспективной для дальнейших исследований. В следующем этапе планируется обучение специальной модели, заточенной именно под поиск информации, необходимой для устранения багов. Такая «поисковая» модель может помогать более крупной системе, снижая расходы на вычисления.



Скепсис в отношении полной замены программистов ИИ не нов. Уже есть немало исследований, показывающих, что даже если модель способна собрать простое приложение, её код часто содержит баги и уязвимости, которые она не в состоянии исправить. Так что текущий путь скорее ведёт не к полной автономии ИИ, а к созданию эффективного помощника, способного экономить разработчику время, но не заменять его полностью.
Подробнее:

Авторизируйтесь или Зарегистрируйтесь что бы просматривать ссылки.

 
Похожие темы
D 150k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
D 489.6k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
D 49.5k Microsoft D4RKNETHUB CLOUD Раздачи и сливы 0
Support81 Новая тактика «Призрачных звонков» использует Zoom и Microsoft Teams для операций C2 Новости в сети 0
Support81 Вирус-вымогатель Akira использует инструмент настройки процессора, чтобы отключить Microsoft Defender Новости в сети 0
ValidMail ♋ 14kk MICROSOFT DOMAIN WITH VALID 05/08/25 ♋ Раздачи и сливы 0
ValidMail ♋ 1.2 MILLION MICROSOFT DOMAIN (HAVE VALID) 30/07/25 ♋ Раздачи и сливы 0
Support81 Microsoft снова сыграла на руку хакерам — корпоративные сети ломают через официальный софт Новости в сети 0
ValidMail ♋ 32k MICROSOFT DOMAINS WITH VALID 21.05.25 ♋ Раздачи и сливы 0
Support81 Плати или рискуй: Microsoft будет брать плату за обновления Windows Новости в сети 0
BinaryCloud (62.263 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (101.200 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (78.231 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (73.764 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (58.262 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (93.164 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (89.879 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (117.025 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (69.533 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (63.984 lines) UHQ Leak Combos Microsoft Domain Раздачи и сливы 0
BinaryCloud (109.903 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
BinaryCloud (117.840 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (94.664 lines) Semi Private Microsoft Domain Leak Раздачи и сливы 0
BinaryCloud (102.339 lines) Good leak Microsoft Domain BinaryCloud Раздачи и сливы 0
Support81 Разработчики игр восстали против нового игрового инструмента искусственного интеллекта от Microsoft Новости в сети 0
Support81 Storm-2372: конференции в Microsoft 365 стали инструментом кражи гостайны Новости в сети 0
Support81 Банды программ-вымогателей выдают себя за ИТ-поддержку в фишинговых атаках на Microsoft Teams Новости в сети 0
Support81 BadRAM: как взломать облака Amazon, Google и Microsoft за $10 Новости в сети 0
Support81 Microsoft сокрушила фишинг-империю: уничтожено 240 сайтов MRxC0DER Новости в сети 0
ValidMail ♋ 54k MICROSOFT DOMAINS WITH VALID 01.11.24 ♋ Раздачи и сливы 0
Support81 Sway и QR-коды: опасный фишинговый тандем, нацеленный на сервисы Microsoft 365 Новости в сети 0
Support81 CloudSorcerer: хакеры шпионят за российскими чиновниками через Microsoft Graph, Yandex Cloud и Dropbox Новости в сети 0
Support81 Роaring Kitty – легенда или аферист: Microsoft India втянута в мошенническую схему Новости в сети 0
Support81 Функция Recall от Microsoft — шаг к тотальному наблюдению? Новости в сети 0
Support81 Amazon, Google и Microsoft открыты для хакеров: ошибка Fluent Bit дает доступ к данным Новости в сети 0
Emilio_Gaviriya Статья Защита и надёжность: Важность патчей для Microsoft Active Directory. Вирусология 0
Support81 Не только умный, но и опасный: темная сторона ИИ от Microsoft Новости в сети 0
Support81 Уязвимость Microsoft Office становится временной бомбой в руках киберпреступников Новости в сети 0
Support81 Пользователи Microsoft 365 рискуют потерять аккаунт: не спасёт даже МФА Новости в сети 0
Support81 Вот это поворот: Microsoft Defender стал помечать Tor Browser как вредоносное ПО Новости в сети 2
Support81 Похитители cookie: Microsoft предупреждает о росте числа атак «человек посередине» с обходом MFA Новости в сети 0
Support81 Киберпреступники активно подделывают системы авторизации Microsoft и Adobe Новости в сети 0
phantom_gift AMAZON & MICROSOFT & PAYPAL - Отработаю ваши логи Ищу работу. Предлагаю свои услуги. 1
K kamisama refund service | Amazon 15% | Logitech | Microsoft | Ищу работу. Предлагаю свои услуги. 1
Denik Интересно Хакерская группировка АРТ31 впервые атаковала российские компании Microsoft обвиняла ее в атаке на участников выборов президнта США 2020 года Новости в сети 0
J Аккаунт microsoft azure 200$ balance Дедики/VPN/соксы/ssh 0
Denik Интересно Эксперты Microsoft нашли критические баги в роутерах Netgear Новости в сети 0
E Microsoft Defender ATP принял обновление для Chrome за троянское ПО Новости в сети 1
Р Получаем Дедик microsoft Раздачи и сливы 1
АнАлЬнАя ЧуПаКаБрА Microsoft.com Reg Checker || XAPIC Готовый софт 2

Название темы