
Creșterea rapidă a puterii de inferență AI oferă context util unui coleg din tech care urmărește transformarea infrastructurii cloud.

Marile companii cloud investesc în forță în AI Firul poveștii și fapte cheie
Principalele cinci companii cloud din America de Nord — Google, Amazon, Microsoft, Meta și Oracle — pregătesc o extindere majoră a infrastructurii AI pentru a răspunde cererii crescânde de servicii comerciale bazate pe inteligență artificială. Potrivit unui raport TrendForce, puterea de procesare dedicată inferenței AI ar urma să crească cu aproximativ 122% în 2026 față de 2025, atingând un nivel total de peste 81 de ExaFLOPS. Această creștere explozivă este alimentată de achiziții masive de servere AI, în special cele bazate pe procesoarele NVIDIA, care domină piața globală. În paralel, companiile investesc și în dezvoltarea propriilor cipuri specializate, cum sunt TPU de la Google și Trainium de la Amazon, pentru a reduce dependența de furnizori externi. Totuși, această expansiune vine cu un cost energetic semnificativ: consumul total de energie al serverelor cloud ar urma să crească cu 18 GW în 2026, un salt de 116% față de anul anterior. Acest trend reflectă cursa globală pentru liderat în domeniul AI, unde performanța infrastructurii devine un avantaj competitiv esențial.
Fapte
- Principalii cinci furnizori de cloud din America de Nord vor crește puterea de procesare pentru inferență AI cu 122% până în 2026.
- Google, Amazon, Microsoft, Meta și Oracle vor reprezenta peste 60% din cererea globală pentru serverele NVIDIA GB și VR în 2026.
- Estimările indică o creștere a consumului energetic cu 18 GW în 2026 față de anul anterior, un salt de 116%.
- Livările globale de servere AI vor crește cu peste 28% în 2026, dominând serverele pentru antrenarea modelelor.
- Amazon așteaptă ca platforma Trainium să reprezinte peste 40% din livrările proprii de servere AI în 2026.
Explicație vizuală de știri Canto. Instrumentele AI pot sprijini producția. Politica editorială





