Construiește de la zero un calculator al unei expresii matematice în C++

Te-ai întrebat vreodată cum funcționează un simplu calculator de buzunar sau aplicația de calcul de pe telefon? 🤔 Cum reușește să înțeleagă o expresie complexă precum (2 + 3) * 4 / 2 - 1 și să returneze rezultatul corect? Ei bine, în acest articol, vom porni într-o călătorie fascinantă pentru a demistifica acest proces, construind de la zero un calculator de expresii matematice folosind puterea și flexibilitatea C++. Nu este doar un exercițiu de programare, ci o modalitate excelentă de a înțelege fundamentele compilatoarelor și interpretoarelor, elemente esențiale în lumea software-ului modern.

De Ce Să Construim Un Calculator? 💡

Pe lângă satisfacția de a crea ceva funcțional, construirea unui astfel de instrument ne oferă o perspectivă valoroasă asupra mai multor concepte fundamentale din informatică:

Parsarea Sintactică: Cum transformăm un șir de caractere într-o structură pe care un program o poate înțelege.
Structuri de Date: Utilizarea eficientă a stivelor (stacks) și cozilor (queues) în algoritmi.
Design de Algoritmi: Înțelegerea și implementarea algoritmilor clasici precum Shunting-yard.
Gândire Logică: Abordarea problemelor complexe prin descompunerea lor în pași mai mici și mai ușor de gestionat.

C++ este alegerea perfectă pentru acest proiect. Oferă control detaliat asupra memoriei și performanței, fiind ideal pentru a înțelege exact ce se întâmplă „sub capotă”.

Anatomia Unei Expresii Matematice 🤓

Pentru noi, oamenii, o expresie precum 2 + 3 * 4 este ușor de interpretat. Știm instinctiv că înmulțirea are prioritate, deci calculăm 3 * 4 = 12, apoi adunăm 2 + 12 = 14. Dar un calculator nu are acest „instinct”. El vede doar un șir de caractere. Pentru a-l face să înțeleagă, trebuie să trecem prin trei etape esențiale:

Lexical Analysis (Tokenizare): Împărțirea șirului de intrare în unități elementare numite „token-uri”.
Syntactic Analysis (Parsare): Transformarea secvenței de token-uri într-o formă pe care mașina o poate evalua cu ușurință.
Evaluation: Calcularea rezultatului final din forma parsată.

Pasul 1: Lexer-ul sau Tokenizatorul 🛠️

Imaginați-vă lexer-ul ca pe un cititor atent care parcurge expresia caracter cu caracter și grupează caracterele în unități logice. De exemplu, în expresia (2 + 3) * 4:

( devine un token de tip LPAREN (paranteză stânga)
2 devine un token de tip NUMBER cu valoarea 2
+ devine un token de tip PLUS
3 devine un token de tip NUMBER cu valoarea 3
) devine un token de tip RPAREN (paranteză dreapta)
* devine un token de tip MULTIPLY
4 devine un token de tip NUMBER cu valoarea 4

Fiecare token are un tip (e.g., operator, număr, paranteză) și, în cazul numerelor, o valoare asociată. În C++, am putea defini o structură Token și un enum pentru tipurile de token-uri. O funcție tokenize(string input) ar returna un std::vector.

Pasul 2: Parser-ul și Algoritmul Shunting-Yard 🚄

Aceasta este inima calculatorului nostru! Oamenii scriu expresii în notație infixată (operatorul între operanzi, e.g., A + B). Calculatoarele, însă, le evaluează mai ușor în notație postfixată sau Reverse Polish Notation (RPN) (operatorul după operanzi, e.g., A B +). De ce? În RPN, nu mai este nevoie de paranteze sau de reguli de precedență complicate; ordinea operațiilor este inerentă în aranjament.

Algoritmul Shunting-yard, inventat de Edsger Dijkstra, transformă o expresie infixată într-o expresie postfixată. El folosește două structuri de date principale:

O coadă de ieșire (output queue) pentru a stoca token-urile în RPN.
O stivă de operatori (operator stack) pentru a gestiona operatorii și parantezele.

Iată o descriere simplificată a logicii (cu reguli pentru precedența operatorilor – înmulțirea și împărțirea au precedență mai mare decât adunarea și scăderea):

Dacă token-ul este un număr, adaugă-l direct în coada de ieșire.
Dacă token-ul este un operator (+, -, *, /):
- Cât timp stiva de operatori nu este goală ȘI operatorul din vârful stivei are o precedență mai mare sau egală decât operatorul curent (și nu este o paranteză stânga), scoate operatorul din stivă și adaugă-l în coada de ieșire.
- Apoi, împinge operatorul curent în stiva de operatori.
Dacă token-ul este o paranteză stânga ((), împinge-o în stiva de operatori.
Dacă token-ul este o paranteză dreapta ()):
- Cât timp operatorul din vârful stivei nu este o paranteză stânga, scoate-l din stivă și adaugă-l în coada de ieșire.
- Scoate paranteza stânga din stivă (dar nu o adăuga în coada de ieșire).
- Dacă stiva de operatori devine goală și nu am găsit o paranteză stânga, înseamnă că există o eroare de parantezare.
Când s-au procesat toate token-urile din intrare, scoate toți operatorii rămași din stiva de operatori și adaugă-i în coada de ieșire. Dacă rămân paranteze în stivă, este o eroare.

Pointerek a C és C++ világában: mikor érdemesebb őket használni sima változók vagy referenciák helyett?

Rezultatul acestui pas va fi o listă de token-uri în format RPN.

Pasul 3: Evaluatorul RPN 🧮

Odată ce avem expresia în RPN, evaluarea este surprinzător de simplă. Folosim o singură stivă de operanzi:

Parcurgem token-urile RPN de la stânga la dreapta.
Dacă token-ul este un număr, îl împingem în stiva de operanzi.
Dacă token-ul este un operator:
- Scoatem doi operanzi din vârful stivei (primul scos este al doilea operand, al doilea scos este primul operand).
- Efectuăm operația (e.g., operand1 + operand2).
- Împingem rezultatul înapoi în stiva de operanzi.
La final, după procesarea tuturor token-urilor RPN, singurul element rămas în stiva de operanzi este rezultatul final al expresiei.

Această metodă este incredibil de elegantă și eficientă, eliminând complexitatea gestiunii priorităților operatorilor. ✅

Implementarea în C++: Detalii și Structuri de Date 💻

Structura `Token` și Tipuri de Token-uri:

În C++, am putea folosi un enum class pentru a defini tipurile de token-uri și o struct sau class Token pentru a le reprezenta:


enum class TokenType {
    NUMBER,
    PLUS, MINUS, MULTIPLY, DIVIDE,
    LPAREN, RPAREN,
    END
};

struct Token {
    TokenType type;
    double value; // Relevant doar pentru NUMBER
    char op_char; // Relevant pentru operatori/paranteze

    Token(TokenType t, double v = 0.0, char c = '') : type(t), value(v), op_char(c) {}
};

Precedența Operatorilor:

Vom avea nevoie de o funcție sau un std::map care să ne spună precedența fiecărui operator. De exemplu:

+, -: precedență 1
*, /: precedență 2

și o funcție pentru a verifica asociativitatea (majoritatea operatorilor sunt stânga-asociativi).

Utilizarea Stivelor și Vectorilor:

std::vector ar fi perfect pentru a stoca token-urile generate de lexer și apoi pentru coada de ieșire RPN. Pentru stiva de operatori și stiva de operanzi, std::stack sau std::stack (pentru evaluare) sunt alegeri excelente, oferind operații push, pop și top.

Gestionarea Ererilor:

Un calculator robust trebuie să gestioneze erorile. Ce se întâmplă dacă utilizatorul introduce 2 + * 3 sau (2 + 3?

Erori Lexicale: Caractere necunoscute.
Erori Sintactice: Paranteze neechilibrate, operatori la locul nepotrivit.
Erori Aritmetice: Împărțirea la zero.

Putem folosi excepții (throw std::runtime_error("...")) pentru a semnala aceste probleme și a opri calculul, informând utilizatorul despre ce nu a mers bine.

Un Exemplu Pas cu Pas: `(2 + 3) * 4` 📝

Să urmărim cum s-ar procesa expresia (2 + 3) * 4:

1. Tokenizare:

Intrare: (, 2, +, 3, ), *, 4

2. Parsare (Shunting-Yard):

Token	Stiva Operatori	Coada Ieșire (RPN)	Observații
`(`	`[ ( ]`		Paranteză stânga: push în stivă
`2`	`[ ( ]`	`[ 2 ]`	Număr: push în coada de ieșire
`+`	`[ ( , + ]`	`[ 2 ]`	Operator: push în stivă
`3`	`[ ( , + ]`	`[ 2 , 3 ]`	Număr: push în coada de ieșire
`)`	`[ ( ]`	`[ 2 , 3 , + ]`	Paranteză dreapta: pop `+` în ieșire, pop `(` din stivă
`*`	`[ * ]`	`[ 2 , 3 , + ]`	Operator: push în stivă
`4`	`[ * ]`	`[ 2 , 3 , + , 4 ]`	Număr: push în coada de ieșire
(Final)		`[ 2 , 3 , + , 4 , * ]`	Pop `*` din stivă în ieșire

Cauți o alternativă CPanel? Top 5 panouri de control pentru administrarea serverului tău

Rezultatul RPN: 2 3 + 4 *

3. Evaluare RPN:

Token RPN	Stiva Operanzi	Observații
`2`	`[ 2 ]`	Număr: push în stivă
`3`	`[ 2 , 3 ]`	Număr: push în stivă
`+`	`[ 5 ]`	Operator: pop 3, pop 2, 2 + 3 = 5, push 5
`4`	`[ 5 , 4 ]`	Număr: push în stivă
`*`	`[ 20 ]`	Operator: pop 4, pop 5, 5 * 4 = 20, push 20

Rezultat Final: 20. Corect! ✅

Extinderea Funcționalității: De la Simplu la Complex 🚀

Odată ce ai o bază funcțională, poți extinde calculatorul pentru a gestiona scenarii mai complexe:

Funcții Matematice: Adaugă suport pentru sin(), cos(), sqrt(), log(). Acestea ar fi tratate ca niște token-uri speciale în lexer și ar avea o logică particulară în Shunting-yard (similară parantezelor) și apoi în evaluator.
Variabile: Permite utilizatorilor să definească și să folosească variabile (e.g., x = 10; x + 5;). Acest lucru necesită un „tabel de simboluri” (std::map) și o logică suplimentară în parser.
Numere Negative: Gestionarea operatorului unar minus (e.g., -5 + 2). Acest lucru poate fi un pic dificil de diferențiat de operatorul binar de scădere. De obicei, se face o pre-procesare pentru a converti minusul unar într-un token diferit sau se adoptă o convenție în lexer.
Interfață Utilizator: De la o interfață simplă în linia de comandă (CLI) la o interfață grafică (GUI) folosind biblioteci precum Qt sau SFML.

Opinii și Perspective Personale 🤔

Construirea unui calculator de expresii nu este doar un proiect tehnic; este o incursiune în logica fundamentală a modului în care computerele procesează limbajul. Este o temă clasică de informatică, dar relevanța sa rămâne actuală. De fapt, principiile de tokenizare și parsare pe care le-am explorat aici sunt exact cele folosite în construirea compilatoarelor pentru limbaje de programare precum C++, Java sau Python, precum și în dezvoltarea bazelor de date, a sistemelor de operare și a aplicațiilor de prelucrare a datelor. Când scrii cod, un compilator traduce acele instrucțiuni într-un limbaj mașină, iar acest proces începe cu exact etapele de lexare și parsare. Fiecare interacțiune cu un limbaj de interogare (SQL) sau un limbaj de scripting implică un interpretor care folosește metode similare. A înțelege cum funcționează un calculator de expresii îți oferă o înțelegere mai profundă a întregului ecosistem software.

A construi un calculator de expresii matematice de la zero în C++ nu este doar un simplu exercițiu de programare; este o piatră de temelie în înțelegerea modului în care limbajele formale sunt procesate de mașini. Este o experiență care te conectează direct cu fundamentele informaticii, transformând concepte abstracte în soluții tangibile și funcționale.

Pe măsură ce avansezi în acest proiect, vei simți cum logica se așează, iar complexitatea aparentă se transformă în eleganță. Este o modalitate excelentă de a-ți exersa abilitățile de rezolvare a problemelor și de a-ți consolida înțelegerea structurilor de date și a algoritmilor. Nu te descuraja de primele eșecuri; ele fac parte din procesul de învățare.

Concluzie 🎉

Am parcurs împreună pașii esențiali pentru a construi un calculator de expresii matematice în C++. De la împărțirea intrării în token-uri, la transformarea expresiei infixate în notație postfixată (RPN) folosind algoritmul Shunting-yard, și în final la evaluarea simplă a RPN-ului. Această călătorie nu doar că îți oferă un instrument util, dar îți echipează și mintea cu concepte puternice, aplicabile într-o multitudine de domenii din dezvoltarea software. Așadar, ia-ți instrumentele, deschide editorul de cod și începe să construiești! Odată ce vei vedea propriul tău calculator funcționând, satisfacția va fi pe măsură. Mult succes! 🚀

Tech

A bolygóméretű város: Sci-fi rémálom vagy a távoli jövőnk, ahol az egész Földet egyetlen metropolisz borítja?

Brutális gyorsulás: Mennyi utat tesz meg egy autó, ha 2 másodperc alatt éri el a 100 km/órát?

Az adatok mögötti struktúra: Így működik a főkomponens-elemzés a gyakorlatban

A szakzsargon útvesztőjében: Mit jelentenek a CFS, GPM, MGD mértékegységek?

A tökéletes páros: Így hozd össze a TP-Link routert a Diginet hálózatával zökkenőmentesen

Tényleg megáll a tudomány? Az Epson dx 7450 és a nyomtatás színes tinta nélkül

Express Posts List

Fără sunet? Cum rezolvi o problemă de sunet la placa de bază Gigabyte B450M DS3H

Obține culorile perfecte: Cum ajustezi corect setările de temperatură a culorii la monitor

Vrei să știi cum se dezactivează tastatura de la laptop? Ghid pas cu pas pentru orice model

Ghid complet: Cum să activezi și să depanezi transmisia de sunet prin HDMI

Convenabil, dar riscant? Totul despre funcția de autocompletare nume utilizator/parolă pe forum

Lasă un răspuns Anulează răspunsul

Recomandate

`Refresh-uri` necontrolate în aplicația ta? Descoperă cauzele și soluțiile

== sau ===? Ghid complet pentru `recunoașterea a două valori egale` și capcanele de evitat

Metode corecte pentru `includere php in alt cod php` fără a-ți strica aplicația

Dezbaterea finală: Este `TDD bun sau rau` pentru proiectul tău PHP?

Soluție elegantă pentru `aranjarea elementelor unui vector intr-un alt vector`

Totul despre `Array` în PHP: Ghidul începătorului pentru manipularea datelor

Olvastad már?

Fără sunet? Cum rezolvi o problemă de sunet la placa de bază Gigabyte B450M DS3H

Obține culorile perfecte: Cum ajustezi corect setările de temperatură a culorii la monitor

Vrei să știi cum se dezactivează tastatura de la laptop? Ghid pas cu pas pentru orice model

Ghid complet: Cum să activezi și să depanezi transmisia de sunet prin HDMI

Convenabil, dar riscant? Totul despre funcția de autocompletare nume utilizator/parolă pe forum

Nu rata asta

Fără sunet? Cum rezolvi o problemă de sunet la placa de bază Gigabyte B450M DS3H

Obține culorile perfecte: Cum ajustezi corect setările de temperatură a culorii la monitor

Vrei să știi cum se dezactivează tastatura de la laptop? Ghid pas cu pas pentru orice model

Ghid complet: Cum să activezi și să depanezi transmisia de sunet prin HDMI

Tech

Express Posts List

De Ce Să Construim Un Calculator? 💡

Anatomia Unei Expresii Matematice 🤓

Pasul 1: Lexer-ul sau Tokenizatorul 🛠️

Pasul 2: Parser-ul și Algoritmul Shunting-Yard 🚄

Pasul 3: Evaluatorul RPN 🧮

Implementarea în C++: Detalii și Structuri de Date 💻

Structura Token și Tipuri de Token-uri:

Precedența Operatorilor:

Utilizarea Stivelor și Vectorilor:

Gestionarea Ererilor:

Un Exemplu Pas cu Pas: (2 + 3) * 4 📝

1. Tokenizare:

2. Parsare (Shunting-Yard):

3. Evaluare RPN:

Extinderea Funcționalității: De la Simplu la Complex 🚀

Opinii și Perspective Personale 🤔

Concluzie 🎉

Lasă un răspuns Anulează răspunsul

Recomandate

Nu rata asta

Structura `Token` și Tipuri de Token-uri:

Un Exemplu Pas cu Pas: `(2 + 3) * 4` 📝