панде

Пандас реад_цсв Водич

Пандас реад_цсв Водич

Панде .реад_цсв

Већ сам разговарао о некој историји и употреби панди Питхон библиотеке.  пандас је дизајниран из потребе за ефикасном библиотеком за анализу финансијских података и манипулацијом за Питхон.  Да би учитали податке за анализу и манипулацију, панде пружају две методе, ДатаРеадер и реад_цсв.  Овде сам покрио прво.  Ово друго је тема овог водича.

.реад_цсв

Постоји велики број бесплатних спремишта података на мрежи која укључују информације о разним пољима.  Неке од тих ресурса сам уврстио у доњи референтни одељак.  Будући да сам демонстрирао уграђене АПИ-је за ефикасно повлачење финансијских података овде, користићу други извор података у овом упутству.

Подаци.гов нуди огроман избор бесплатних података о свему, од климатских промена до У.С. статистика производње.  Преузео сам два скупа података за употребу у овом упутству.  Прва је средња дневна максимална температура за Баи Цоунти, Флорида. Ови подаци су преузети са У.С. Приручник о климатској отпорности за период 1950. до данас.

Друго је истраживање робног тока које мери начин и обим увоза у земљу током петогодишњег периода.

Обе везе за ове скупове података налазе се у одељку референци у наставку.  Тхе .реад_цсв метода, као што је јасно из назива, учитаће ове податке из ЦСВ датотеке и инстанцирати а Оквир података ван тог скупа података.

Употреба

Сваки пут када користите спољну библиотеку, морате да кажете Питхону да је треба увести.  Испод је линија кода која увози библиотеку панди.

увези панде као пд

Основна употреба .реад_цсв метода је доле наведена.  Ово инстанцира и попуњава а Оквир података дф са информацијама у ЦСВ датотеци.

дф = пд.реад_цсв ('12005-годишња-историја-обс-тасмак.цсв ')

Додавањем још неколико редова можемо да прегледамо првих и последњих 5 редова из новоствореног ДатаФраме-а.

дф = пд.реад_цсв ('12005-годишња-хист-обс-тасмак.цсв ')
испис (дф.глава (5)
испис (дф.реп (5))

Код је учитао колону за годину, средњу дневну температуру у Целзијусу (тасмак) и конструисао шему индексирања засновану на 1 која се увећава за сваки ред података.    Такође је важно напоменути да се заглавља попуњавају из датотеке.  Уз основну употребу горе представљене методе, закључује се да су заглавља у првом реду ЦСВ датотеке.  Ово се може променити прослеђивањем различитог скупа параметара методи.

Параметри 

Дао сам везу до панди .реад_цсв документација у референцама испод.  Постоји неколико параметара који се могу користити за промену начина читања и форматирања података у Оквир података.

Постоји приличан број параметара за .реад_цсв метода.  Већина није потребна, јер ће већина скупова података које преузмете имати стандардни формат.  То су колоне у првом реду и граничник зареза.

Постоји неколико параметара које ћу истакнути у водичу, јер могу бити корисни.  Опсежније истраживање може се преузети са странице документације.

индек_цол

индек_цол је параметар који се може користити за означавање колоне која садржи индекс.  Неке датотеке могу садржати индекс, а неке не.  У нашем првом скупу података, дозволио сам да питхон креира индекс.  Ово је стандард .реад_цсв понашање.

У наш други скуп података укључен је индекс. Код испод учитава Оквир података са подацима у ЦСВ датотеци, али уместо да креира инкрементални целобројни индекс користи ступац СХПМТ_ИД укључен у скуп података.

дф = пд.реад_цсв ('цфс_2012_пумф_цсв.ткт ', индек_цол =' СХИПМТ_ИД ')
испис (дф.глава (5)
испис (дф.реп (5))

Иако овај скуп података користи исту шему за индекс, други скупови података могу имати кориснији индекс.

нровс, скипровс, усецолс

Код великих скупова података можда ћете желети учитати само делове података.  Тхе нровс, скипровс, и усецолс параметри ће вам омогућити да исечете податке укључене у датотеку.

дф = пд.реад_цсв ('цфс_2012_пумф_цсв.ткт ', индек_цол =' СХИПМТ_ИД ', нровс = 50)
испис (дф.глава (5)
испис (дф.реп (5))

Додавањем нровс параметар са целобројном вредношћу 50, .таил цалл сада враћа линије до 50.  Остатак података у датотеци се не увози.

дф = пд.реад_цсв ('цфс_2012_пумф_цсв.ткт ', скипровс = 1000)
испис (дф.глава (5)
испис (дф.реп (5))

Додавањем скипровс параметар, наш .глава цол не приказује почетни индекс 1001 у подацима.  Будући да смо прескочили ред заглавља, нови подаци су изгубили заглавље и индекс на основу података датотеке.  У неким случајевима је можда боље податке пресецати у а Оквир података него пре учитавања података.

Тхе усецолс је користан параметар који вам омогућава да увозите само подскуп података по колони.  Може му се проследити нулти индекс или листа низова са именима колона.  Користила сам доњи код за увоз прва четири ступца у наш нови Оквир података.

дф = пд.реад_цсв ('цфс_2012_пумф_цсв.ткт ',
индек_цол = 'СХИПМТ_ИД',
нровс = 50, усецолс = [0,1,2,3])
испис (дф.глава (5)
испис (дф.реп (5))

Од нашег новог .глава зови, наш Оквир података сада садржи само прве четири колоне из скупа података.

мотор

Последњи параметар који би ми добро дошао у неким скуповима података је мотор параметар.  Можете користити или механизам заснован на Ц или код заснован на Питхону.  Мотор Ц биће природно бржи.  Ово је важно ако увозите велике скупове података.  Предности рашчлањивања Питхона су скуп богатијих карактеристика.  Ова погодност може значити мање ако учитавате велике податке у меморију.

дф = пд.реад_цсв ('цфс_2012_пумф_цсв.ткт ',
индек_цол = 'СХИПМТ_ИД', мотор = 'ц')
испис (дф.глава (5)
испис (дф.реп (5))

Пратити

Постоји неколико других параметара који могу проширити подразумевано понашање .реад_цсв метода.  Они се могу наћи на страници докумената на коју сам навео у наставку.  .реад_цсв је корисна метода за учитавање скупова података у панде за анализу података.  Будући да многи бесплатни скупови података на Интернету немају АПИ-је, ово ће се показати најкориснијим за апликације ван финансијских података где постоје робусни АПИ-ји за увоз података у панде.

Референце

хттпс: // панде.пидата.орг / пандас-доцс / стабле / генератед / пандас.реад_цсв.хтмл
хттпс: // ввв.подаци.гов /
хттпс: // сет алата.клима.гов / # истраживач климе
хттпс: // ввв.Попис.гов / ецон / цфс / пумс.хтмл

Најбоље игре за ручно праћење
Оцулус Куест је недавно представио сјајну идеју ручног праћења без контролера. Са све већим бројем игара и активности које извршавају подршку формално...
Како приказати ОСД прекривач у целом екрану Линук апликација и игара
Играње игара преко целог екрана или коришћење апликација у режиму целог екрана без ометања може вам одсећи релевантне системске информације видљиве на...
Топ 5 карата за хватање игара
Сви смо видели и волели стримовање играња на ИоуТубе-у. ПевДиеПие, Јакесептицие и Маркиплиер само су неки од најбољих играча који су зарадили милионе ...