Excel: sorrendi adat kinyerése másik oszlopból

Az Excel az egyik leghatékonyabb eszköz az adatok rendszerezésére, elemzésére és vizualizálására. Gyakran találkozunk azzal a feladattal, hogy egy adott kritérium (például érték nagysága) alapján rendeznünk kell az adatokat, majd ehhez a sorrendhez tartozó információkat kell kinyernünk egy másik oszlopból. Gondoljunk csak egy eladási listára, ahol a legmagasabb forgalmat elérő termék nevét vagy a legjobb diák pontszámát keressük. Ebben a cikkben mélyrehatóan bemutatjuk, hogyan tehetjük meg ezt az adat kinyerést hatékonyan, különböző képletek és módszerek segítségével, a legegyszerűbbtől a haladóig.

Miért Fontos a Sorrendi Adat Kinyerése?

Az adatkezelés során kulcsfontosságú, hogy ne csak az „első helyezettet” találjuk meg, hanem a második, harmadik, vagy akár a tizedik legjobb (vagy legrosszabb) értéket is, és ami még fontosabb, hogy megtudjuk, mi tartozik hozzájuk. Ez az analízis segít azonosítani a kulcsfontosságú elemeket, trendeket és anomáliákat. Például:

Az 5 legnyereségesebb ügyfél azonosítása.
A 10 legkevésbé hatékony munkatárs teljesítményének felmérése.
A leggyakrabban előforduló hibakódok listázása.
Egy verseny eredményhirdetése, a helyezettek nevével.

Az Excel beépített funkciói lehetővé teszik számunkra, hogy ezeket a feladatokat automatizáltan, néhány képlet segítségével végezzük el, elkerülve a manuális rendezést és másolást, ami időigényes és hibalehetőségeket rejt.

Az Alapok: NAGY (LARGE) és KIS (SMALL) Függvények

Mielőtt áttérnénk a bonyolultabb esetekre, értsük meg a két alapvető függvényt, amelyek a sorrendi adatok alapját képezik:

NAGY (LARGE): Ez a függvény egy adatcsoportból kiválasztja a k-adik legnagyobb értéket.

Szintaxis: =NAGY(tömb; k)

Példa: =NAGY(A1:A10; 1) megadja a legnagyobb értéket, =NAGY(A1:A10; 3) a harmadik legnagyobbat.
KIS (SMALL): Hasonlóan működik, de a k-adik legkisebb értéket adja vissza.

Szintaxis: =KIS(tömb; k)

Példa: =KIS(A1:A10; 2) megadja a második legkisebb értéket.

Ezek a függvények önmagukban csak magát az értéket adják vissza, de nem mondják meg, hogy melyik elemtől származik ez az érték. Itt jön a képbe az INDEX és HOL.VAN (MATCH) függvények kombinációja.

Adat Kinyerése Másik Oszlopból: Az INDEX és HOL.VAN Kéz a Kézben

Ez a kombináció az Excel egyik leggyakrabban használt és legerősebb fegyvere a komplex adatkinyerésre. A célunk az, hogy a k-adik legnagyobb (vagy legkisebb) értékhez tartozó, tőle eltérő oszlopban lévő adatot kapjuk meg.

INDEX: Egy tartományból vagy tömbből visszaadja a megadott sorszámú (és oszlopszámú) cella értékét.

Szintaxis: =INDEX(tömb; sorszám; [oszlop_szám])
HOL.VAN (MATCH): Megadja egy elem relatív pozícióját egy tartományban.

Szintaxis: =HOL.VAN(keresési_érték; keresési_tömb; [egyezés_típus]) (Az egyezés_típus általában 0 a pontos egyezéshez).

Lépésről Lépésre Példa

Tegyük fel, hogy van egy terméklista az ‘A’ oszlopban, és a hozzájuk tartozó eladások a ‘B’ oszlopban:

A oszlop     B oszlop
Termék A      150
Termék B      230
Termék C      100
Termék D      230
Termék E      180

Célunk: Kinyerni a 2. és 3. legmagasabb eladást elérő termékek nevét.

Keressük meg a 2. legnagyobb eladási értéket:
=NAGY(B:B; 2)
Ez 230-at ad vissza.
Keressük meg, hol található ez az érték a ‘B’ oszlopban:
=HOL.VAN(NAGY(B:B; 2); B:B; 0)
Ez 2-t ad vissza, mert a 230 a második sorban (Termék B) található először.
Keressük ki a megfelelő terméknevet az ‘A’ oszlopból:
=INDEX(A:A; HOL.VAN(NAGY(B:B; 2); B:B; 0))
Ez a képlet Termék B-t ad vissza, ami a 2. legmagasabb eladású termék neve.

Mi történik, ha a 3. legmagasabb eladást keressük? Ugyanez a képlet a Termék B-t adja vissza, mert a NAGY(B:B; 3) szintén 230, és a HOL.VAN mindig az első találatot adja vissza. Ezzel el is jutottunk a következő problémához: a kötött rangok, azaz a duplikált értékek kezeléséhez.

Kötött Rangok (Ties) Kezelése: A RANG.EQ, RANG.ÁTL és Egyedi Azonosítók

Ha a rangsorolni kívánt oszlopban ismétlődő értékek vannak, az INDEX + HOL.VAN + NAGY/KIS kombináció csak az első előfordulást adja vissza. Ha minden egyező értékhez tartozó adatot ki akarunk nyerni, egy kifinomultabb megközelítésre van szükség.

Excel-Effizienz: Wie Sie eine Tabelle ergänzen und gleichzeitig vorhandene Daten aussortieren

A RANG.EQ (RANK.EQ) és RANG.ÁTL (RANK.AVG) Függvények

RANG.EQ (RANK.EQ): Visszaadja egy szám rangját a listában. Ha ismétlődő értékek vannak, ugyanazt a rangot kapják, és a következő rang kihagyódik.

Szintaxis: =RANG.EQ(szám; hivatkozás; [sorrend])
RANG.ÁTL (RANK.AVG): Hasonlóan működik, de az ismétlődő értékek esetén az átlagos rangot adja vissza.

Ezek önmagukban nem oldják meg az adatok kinyerését, de segítenek megérteni a rangsorolás dinamikáját. A duplikált értékek kinyeréséhez a kulcs a HOL.VAN függvény „előítéletének” kiküszöbölése, azaz olyan egyedi azonosítók létrehozása, amelyek segítik az Excelnek megkülönböztetni az azonos értékeket.

Megoldás Kötött Rangokhoz: Segédoszlop Használata

Az egyik leggyakoribb és legegyszerűbb megoldás egy segédoszlop (pl. ‘C’ oszlop) hozzáadása, amely egyedi azonosítókat hoz létre minden értékhez. Ezt úgy tehetjük meg, hogy a pontszámhoz hozzáadunk egy nagyon kicsi, de egyedi értéket, például a sor számát:

C2 cellába: =B2+(SOR()/1000000) és lehúzva az oszlopon.

Így a 150 lehet 150.000002, a 230 (2. sor) lehet 230.000003, a másik 230 (4. sor) pedig 230.000005. Ezzel a NAGY függvény már „látja” a különbséget, és a HOL.VAN is egyedi találatot ad. Ez a módszer azonban módosítja az eredeti értékeket, ami nem mindig kívánatos.

Robusztusabb Megoldás Kötött Rangokhoz (Tömbképlet vagy INDEX+AGGREGATE)

A segédoszlop nélkül, egyetlen dinamikus tömbképlettel is megoldható a probléma, ami az Excel modernebb verzióiban érhető el, vagy régebbi verziókban Ctrl+Shift+Enterrel beviendő tömbképlettel:

A logikai a következő: Keressük meg a k-adik legnagyobb értéket, majd keressük meg az összes olyan sort, ahol ez az érték szerepel. Ha több van, akkor valamilyen módon adjunk sorszámot ezeknek a találatoknak is.

Ha a NAGY/KIS értékét szeretnénk kinyerni az ismétlődéseket is figyelembe véve, használhatjuk a KICSI (SMALL) függvényt egy bonyolultabb tömbképletben (Ctrl+Shift+Enterrel kell bevinni Excel 2019-ig, 365-ben automatikus):

Példa: A k-adik termék nevét kinyerni (függetlenül az ismétlődésektől):
{=INDEX($A$2:$A$6; KICSI(HA($B$2:$B$6=NAGY($B$2:$B$6;1); SOR($B$2:$B$6)-SOR($B$2)+1); SOR(A1)))}

Ez a képlet megkeresi az 1. legnagyobb értéket ($B$2:$B$6 tartományban), majd a HA (IF) függvénnyel azonosítja azokat a sorokat, ahol ez az érték található. A SOR($B$2:$B$6)-SOR($B$2)+1 rész visszaadja a relatív sorszámokat (1, 2, 3…). A KICSI (SMALL) függvény a SOR(A1)-et használva (ami az 1-et adja vissza, és lehúzva 2-t, 3-at stb.) sorban kiválasztja ezeket a relatív sorszámokat, amit az INDEX fel tud használni. Ezt a képletet le kell húzni annyi cellán, ahány találatot várunk. Ez egy tömbképlet (CSE – Ctrl+Shift+Enter), ami a régebbi Excel verziókban különleges bevitelt igényel.

Haladó Megoldások: AGGREGATE Függvény a Rugalmasságért

Az AGGREGATE (ÖSSZEGZÉS) függvény egy rendkívül sokoldalú eszköz, amely képes elkerülni a hibákat és figyelmen kívül hagyni a rejtett sorokat. Használhatjuk az N-edik érték kinyerésére, és sokkal robusztusabb, mint a hagyományos NAGY/KIS vagy INDEX/HOL.VAN kombinációk, főleg adatszűrés vagy hibaértékek esetén.

Az AGGREGATE szintaxisa bonyolultabb:

=AGGREGATE(függvény_szám; beállítások; tömb; [k])

függvény_szám: Egy szám, ami meghatározza, melyik függvényt használja az AGGREGATE (pl. 14 a NAGY, 15 a KIS).
beállítások: Egy szám, ami meghatározza, mit hagyjon figyelmen kívül (pl. 6 a hibaértékeket és rejtett sorokat).
tömb: Az adathalmaz.
k: A k-adik elem, amit keresünk.

Példa: A harmadik legnagyobb érték kinyerése, figyelmen kívül hagyva a hibákat és a rejtett sorokat:

=AGGREGATE(14; 6; B:B; 3)

Ez egyedül is képes az N-edik érték megtalálására, de ha a hozzá tartozó adatot is ki akarjuk vonni, akkor ismét az INDEX és HOL.VAN segítségére van szükségünk. Az AGGREGATE erőssége, hogy a HOL.VAN résznél is képes figyelmen kívül hagyni a hibaértékeket, ami a hagyományos HOL.VAN-nál nem lehetséges.

Példa: Az N-edik legnagyobb értékhez tartozó név kinyerése, hibákat figyelembe véve:
=INDEX(A:A; AGGREGATE(15; 6; (SOR(B:B)-SOR(B1))/(B:B=AGGREGATE(14; 6; B:B; 1)); 1))

Ez egy meglehetősen komplex képlet, de rendkívül rugalmas és megbízható a bonyolultabb adatkörnyezetekben.

Den Reiter „Datei“ auf Excel abrufen: Wo Sie das Menü finden und was es verbirgt

Dinamikus Tömbképletek (Dynamic Arrays) – A Jövő Eszközei

Az Excel 365 és az újabb verziókban megjelentek a dinamikus tömbök, amelyek forradalmasítják a képlet kezelést. Mostantól egyetlen képlet képes több cellába is „kiömleni” (spill), automatikusan eredményhalmazt generálva. Ez leegyszerűsíti a korábban bonyolult tömbképleteket.

RENDEZÉS.BY (SORTBY)

A RENDEZÉS.BY függvény lehetővé teszi, hogy egy tartományt egy másik (vagy több) tartomány értékei alapján rendezzünk, majd ebből az eredményből vegyük ki az első N sort. Ez tökéletes a top N lista generálására.

Példa: Az eladásokat tartalmazó B oszlop alapján rendezze az A és B oszlopokat csökkenő sorrendben:
=RENDEZÉS.BY(A:B; B:B; -1)

Ez a képlet kiönti a teljes rendezett táblázatot. Ha csak a legelsők kellenek, kombinálhatjuk a TAKE (VÉTEL) függvénnyel:

Példa: Az 3 legmagasabb eladást elérő termék és eladás kinyerése:
=VÉTEL(RENDEZÉS.BY(A:B; B:B; -1); 3)

Ez egy elegáns és egyszerű megoldás, amely azonnal visszaadja a teljes top 3 listát.

SZŰRŐ (FILTER)

Bár a SZŰRŐ függvény elsősorban adatok szűrésére szolgál, kombinálható a NAGY/KIS vagy RANG.EQ függvényekkel, hogy rangsorolt adatokat szűrjön. Például, ha a Top N elemet akarjuk kinyerni, és azok közül is csak azokat, amelyek egy bizonyos kritériumnak megfelelnek.

Példa: Szűrjük ki azokat a termékeket, amelyek a top 3-ban vannak eladás alapján:
=SZŰRŐ(A:B; B:B >= NAGY(B:B; 3))

Ez a képlet az összes olyan sort visszaadja, ahol az eladási érték nagyobb vagy egyenlő a 3. legnagyobb eladási értékkel. Ha több terméknek is azonos a 3. legnagyobb értéke, mindet visszaadja.

Gyakori Hibák és Tippek

Abszolút Hivatkozások ($): Amikor képleteket másolsz, győződj meg róla, hogy a tartományok helyesen vannak-e hivatkozva. Használd a $ jelet az abszolút hivatkozásokhoz (pl. $A$1:$A$10), hogy a tartomány ne mozduljon el a képlet másolásakor.
Adattípusok: Győződj meg róla, hogy a rangsorolt adatok számok legyenek, ne szövegek. Az Excel a számokat és a szövegeket eltérően kezeli.
Teljesítmény: Nagyméretű táblázat (több tízezer sor) esetén a bonyolult tömbképletek lassúvá tehetik a munkafüzetet. Próbáld meg az oszlopokra való hivatkozást (pl. B:B) leszűkíteni a tényleges adatterületre (pl. B2:B1000), vagy használd a Power Query-t nagyobb adathalmazokhoz.
Hibakezelés: Használd az HAHIBA (IFERROR) függvényt a képletek köré, hogy kezelje a lehetséges hibaértékeket (pl. ha nincs elég elem a top N-hez), így a képlet szebb eredményt ad: =HAHIBA(az_eredeti_képlet; "").

Összefoglalás és Következtetés

Az Excel rendkívül sokoldalú az adatkezelés és rangsorolás terén. Ahogy láthattuk, a sorrendi adatok kinyerése más oszlopokból számos módon megközelíthető, a NAGY/KIS, INDEX és HOL.VAN függvények alapvető kombinációjától kezdve, a duplikált értékek kezelésére szolgáló haladó tömbképleteken át, egészen az AGGREGATE rugalmasságáig és a modern dinamikus tömbök (RENDEZÉS.BY, SZŰRŐ) egyszerűségéig.

A megfelelő módszer kiválasztása a problémától, az Excel verziójától és a szükséges rugalmasság mértékétől függ. Gyakorlással és a különböző funkciók megértésével képes leszel bármilyen Excel táblázatból a kívánt sorrendi adatot kinyerni, ezzel jelentősen felgyorsítva az elemzési folyamataidat és pontosabb betekintést nyerve az adataidba. Ne félj kísérletezni és kombinálni ezeket az eszközöket – az Excel ereje a kreatív felhasználásban rejlik!

Tech

A kardió gépek helyes használata: edzéstechnika javítás a futópadon és ellipszis tréneren

A tükör a barátod vagy az ellenséged? Vizuális kontroll az edzéstechnika javítás szolgálatában

Miért záródik be azonnal a .BAT programom? A hiba oka és a legegyszerűbb megoldás

Diploma nélkül a csúcsra? A Big Data Scientist karrier útja papírok nélkül

Programozás gyerekeknek: Melyik programozási nyelvvel vezérelhet hardvert egy 10 éves zseni?

Hogy soha ne felejtsd el, merre jártál: a legjobb GPS koordináta rögzítő appok és eszközök

Express Posts List

Edzéstechnika javítás a komplex, több ízületet mozgató gyakorlatoknál

Ne bízd a véletlenre: Kiderítettük, melyik frufru illik leginkább a te arcformádhoz

A megfelelő cipő kiválasztásának hatása az edzéstechnika javítására

Hogyan segíthet a habhenger az edzéstechnika javítás előkészítésében?

A befelé dőlő térdek korrekciója: fókuszált edzéstechnika javítás

Vélemény, hozzászólás? Válasz megszakítása

Kapcsolódnak

C programozási anomáliák: Mi történik, ha számmal töltöd fel a char tömböt fscanf segítségével?

Elakadtál a Visual C# projektfeladattal? Így készíts profi Winform App-ot lépésről lépésre!

Így határozd meg a beolvasott számok összegét és szorzatát anélkül, hogy megizzadnál!

Excel összeadás felsőfokon: Több mint egy egyszerű pluszjel

Szűrés megyék alapján egy excel táblában, ahol csak városok vannak? Íme a trükk, amivel megoldhatod!

Káosz az adatbázisban? Így garantáld, hogy az SQL a rekordok sorrendjét ne keverje össze!

Olvastad már?

Edzéstechnika javítás a komplex, több ízületet mozgató gyakorlatoknál

Ne bízd a véletlenre: Kiderítettük, melyik frufru illik leginkább a te arcformádhoz

A megfelelő cipő kiválasztásának hatása az edzéstechnika javítására

Hogyan segíthet a habhenger az edzéstechnika javítás előkészítésében?

A befelé dőlő térdek korrekciója: fókuszált edzéstechnika javítás

Ne maradj le

Edzéstechnika javítás a komplex, több ízületet mozgató gyakorlatoknál

A megfelelő cipő kiválasztásának hatása az edzéstechnika javítására

A befelé dőlő térdek korrekciója: fókuszált edzéstechnika javítás

Edzéstechnika javítás a pliometrikus gyakorlatoknál a robbanékonyságért