Tech

A mesterséges intelligencia korlátai: Miért botladoznak még a kódoló modellek a hibajavításban?

2025.04.25.

Bár a mesterséges intelligencia alapú eszközök egyre nagyobb teret nyernek a szoftverfejlesztésben, segítve a programozókat az ismétlődő feladatok automatizálásában – ahogy azt a Google (új kódok negyede) és a Stack Overflow felmérése (fejlesztők több mint háromnegyede használja vagy tervezi használni) is mutatja –, egy friss kutatás rávilágít a jelenlegi technológia komoly korlátaira. A Microsoft Research részletes vizsgálatot folytatott arról, hogy a legmodernebb AI-modellek mennyire birkóznak meg a kódokban rejlő hibák felderítésével és javításával, azaz a debuggolással.

A tanulmány kilenc különböző modellt tesztelt, köztük az Anthropic és az OpenAI fejlesztéseit, egy speciális AI-ügynök segítségével, amely hozzáférést kapott hibakereső eszközökhöz, például a Python debuggerhez. A modelleknek az SWE-bench Lite nevű benchmark tesztkészletből kellett 300 különböző hibajavítási feladatot megoldaniuk. Az eredmények kijózanítóak: még a legjobban teljesítő modell, a Claude 3.7 Sonnet is csupán 48,4%-os sikerességi arányt ért el. Az OpenAI o1 modellje 30,2%-ot, míg az o3-mini 22,1%-ot teljesített. Összességében az ügynök még a leghatékonyabb modellekkel sem tudta a feladatok felét sem sikeresen megoldani. Gyakori probléma volt, hogy a modellek nehezen értelmezték vagy használták a rendelkezésükre álló hibakereső eszközöket.

A kutatók szerint a gyenge teljesítmény egyik fő oka a hiányos képzési adatokban keresendő. A jelenlegi adathalmazok nem tükrözik kellőképpen azt a szekvenciális, logikai döntéshozatali folyamatot, amelyet az emberek a hibakeresés során alkalmaznak. Ugyanakkor a jövőben célzottabb képzéssel és finomhangolással ezek a modellek várhatóan hatékonyabbá válhatnak a debuggolás terén is.

Mindezek ellenére a kutatás egyértelművé teszi, hogy a mesterséges intelligencia egyelőre nem képes kiváltani az emberi fejlesztőket, különösen az olyan összetett, logikai gondolkodást igénylő feladatokban, mint a hibakeresés. Bár az AI jelentős segítséget nyújthat a kódírásban, a szoftverek megbízhatóságának garantálásához továbbra is elengedhetetlen a tapasztalt szakemberek felügyelete és beavatkozása.

Virtuális gép és valós gép közötti kommunikáció: megoldások

Tech

Digitális detox: a kimerültség elleni leghatékonyabb fegyver

Otthonról dolgozol? Így kerüld el a digitális kimerültséget

Hogyan vezet a digitális világ a teljes kimerültség állapotába

A folyamatos online jelenlét és a szociális fáradtság

Miért vagy fáradtabb a home office-ban, mint az irodában?

Túl sok a közösségi média? A digitális detox segít a fáradtság ellen!

Express Posts List

Fájlszerkesztők amik mindenki gépére kötelezőek voltak az XP-s korszakban

Vélemény, hozzászólás? Válasz megszakítása

Kapcsolódnak

A gépek lázadása már elkezdődött? Vészjósló jelek, hogy egy embertelenebb világ felé tartunk

Nulláról a kész termékig: Mennyibe kerül egyedi eszköz kifejlesztése napjainkban?

Többet tud a meghajtód, mint gondolnád: Az NEC firmware frissítés lépésről lépésre

Keltsd életre a képeidet: 3D modell készítése 2D fotóból AI segítségével, akár ingyen is

Elvesztél a betűszavak tengerében? Az IT fogalmak rövidítéseinek teljes útmutatója

„A biztonsági másolat készítése sikertelen” – Ne kockáztass adatvesztést, javítsd a hibát most!

Olvastad már?

Fájlszerkesztők amik mindenki gépére kötelezőek voltak az XP-s korszakban

Ne maradj le

Fájlszerkesztők amik mindenki gépére kötelezőek voltak az XP-s korszakban

Miért ébredsz fel minden éjjel ugyanabban az időpontban? Az álmatlanság rejtélye

Az álmatlanság és a libidó csökkenésének összefüggései

A rendszertelen életmód egyenes út az álmatlansághoz