Tech

A mesterséges intelligencia korlátai a kódjavításban: Mit mutatott egy friss teszt?

2025.04.26.

Egy friss Microsoft kutatás világított rá arra a tényre, hogy a mesterséges intelligencia jelenleg messze elmarad az emberi programozók képességeitől, amikor szoftverhibák felderítéséről és javításáról van szó. Bár a technológia egyre elterjedtebb a kódírás segítésében – a Google és a Meta is jelentős mértékben alkalmazza –, a meglévő kódrészletekben rejlő problémák megtalálása más szintű kihívást jelent.

Annak ellenére, hogy nagyvállalatok, mint a Google vagy a Meta, egyre nagyobb mértékben támaszkodnak az MI-re új kódok generálásában (a Google esetében állítólag az új kódok negyedét már MI írja), a programkódokban rejlő hibák azonosítása komoly kihívást jelent még a legfejlettebb modellek számára is. Ez ellentmondani látszik annak a narratívának, hogy az MI hamarosan kiválthatja a fejlesztőket.

A Microsoft szakemberei kilenc különböző MI modellt vizsgáltak meg, köztük az Anthropic és az OpenAI ismert megoldásait, egy standardizált tesztkörnyezetben, a SWE-bench Lite 300 hibajavítási feladatán keresztül. A modellek hozzáférést kaptak különféle hibakereső eszközökhöz is.

Az eredmények kijózanítóak voltak. Még a legjobban teljesítő modell, az Anthropic Claude 3.7 Sonnet is csupán 48,4 százalékos sikerességi arányt ért el átlagosan a hibajavítási feladatokban. Az OpenAI modelljei, az o1 és az o3-mini, ennél is szerényebb, 30,2, illetve 22,1 százalékos eredményt mutattak.

A kutatók szerint ennek oka részben az MI modellek elégtelen betanítása lehetett erre a specifikus feladatra, másrészt pedig nehézségekbe ütköztek a szükséges hibakereső eszközök hatékony használatában. Úgy vélik, a jövőben célzottabb képzéssel és a modellek finomhangolásával javítható lehet ez a teljesítmény, de jelenleg az emberi szakértelem pótolhatatlannak tűnik a komplex hibakeresési feladatokban.

Furcsa hangok használat közben? Amikor a Bosch 2100 W-os takarítógép motorja önálló életre kel

AI teszt Claude 3 hibakeresés kódolás. mesterséges intelligencia Microsoft OpenAI Programozás szoftverfejlesztés

Megosztás Facebookon Megosztás X-en Megosztás Messengeren Megosztás WhatsApp-on Megosztás Viberen

Tech

Mi az a rettegett adathiba (CRC), és hogyan mentsd meg a fájljaidat tőle?

A lehetetlen küldetés: XP VGA driver keresése Amilo Pa 3553-ra

Harc a vason: FuSi AMilo Li 1705 vs. Ubuntu 9.04 – Melyik a nyerő?

A tökéletes laptop telepítés A-tól Z-ig: Útmutató kezdőknek és haladóknak

A nagy küzdelem: Így telepíts XP-t SATA vinyóval szerelt laptopra!

Túl forró a vas? A processzor lassítás szoftveresen, amikor a hűtés már nem elég

Express Posts List

Vélemény, hozzászólás? Válasz megszakítása

Kapcsolódnak

A láthatatlan panel esete: Miért látható a panel elrejtés után is?

A lefordíthatatlan „placeholder” kifejezés nyomában: Helyőrző, helykitöltő vagy valami egészen más?

Tényleg csökken a processzor terhelése, ha minden változót egy Int alá pakolunk? Lerántjuk a leplet a mítoszról!

Ismeretlen kódok fogságában: Nyelv megállapítása és a titkosítás feloldása

A rettegett „Diagnosztikai hiba” üzenet: Hogyan derítsd ki a valódi okot?

Jövőbeli programozóknak: Irodai vagy műszaki informatika a jobb választás a szakközépben?

Olvastad már?

Ne maradj le

„CD/DVD driver hibás” – Így győzd le a Windows 7 RC telepítési rémálmát

Nem működik a kamera? A hiányzó Sony Vaio webcam driver nyomában

Miért nagyítja a képet a VLC? A bosszantó hiba és annak egyszerű javítása

Mutasd meg a fájljaid stílusosan: Így szabd testre az Apache autoindex funkcióját!