Import CSV în Excel mai mult de 1.048.576 linii


Fanii Excel știu probabil că acest instrument este foarte util pentru analize de date dar nu pentru colectarea sau introducerea directă a acestora. În majoritatea cazurilor cantitățile mari de date ajung în Excel pentru analiză prin importul din surse de date externe, pornind de la banale fișiere TXT până la servicii web specializate și baze de date.

Cel mai greu este când avem de importat mai multe fișiere într-un raport centralizat iar suma înregistrărilor depășește valoarea 1.048.676 linii (1024 la puterea a doua sau 2 la puterea 20). Tehnic Excelul nu poate gestiona într-o foaie de calcul mai multe înregistrări. Mulți utilizatori recurg la metoda importului gradual, dar acest fapt implică operațiuni manuale și suplimentare pentru centralizarea sumelor.

Prezentul articol propune metoda importului într-un model de date, nu direct într-o foaie de calcul. Un model este o formă binară de păstrare a datelor necesare prelucrărilor Excel și poate fi interpretat cu ajutorul unui Power Pivot. Aveți aici o referință foarte utilă pentru începătorii în acest domeniu.

În modelul de import prezentat în filmuleț sunt importate 3 fișiere CSV care au însumat peste 1,3 milioane de linii.

În partea de sus a CSV-urile avem un antet din 3 linii: titlul documentului, anii de referință și capul de tabel efectiv. Primele două linii vor fi eliminate în partea de import, iar a treia linie din primul fișier va fi transformată în cap de tabel pentru import. De asemenea, la finalul fiecărui CSV este o linie de totaluri care trebuie eliminată din toate CSV-urile la import.

Pentru a putea importa fișierele folosim limbajul M din Power Query. Lista funcțiilor și operațiunilor posibile este disponibilă la această adresă.

Pentru eliminarea antetelor din celelalte două fișiere se transformă coloana de date în tipul date. Având în vedere că ele nu sunt valori date Power Query va returna un mesaj de eroare. Prin intermediul mesajului de eroare putem elimina liniile respective din import.

După aplicarea pașilor de clean-up și formatare a datelor și coloanelor este foarte important modul în care salvăm modelul prin operațiunea de Cloase and Load To și alegerea opțiunii Add this data in the Data Model.

Ulterior Power Pivotul este foarte asemănător de utilizat ca oricare alt Pivot din Excel.

Sper să vă fie util!

Reclame