PANDAS GİRİŞ 101

Sevgili okurlar hepinize merhaba,

Bugün sizlere Veri Bilimi için önemli olan bir kütüphaneden bahsetmeye çalışacağım.

Başlamadan önce ‘pandas’ kütüphanesini ne için kullandığımızı anlamaya çalışalım.

İlk bakışta veriyi anlamak gerçekten zor hatta imkansız diyebiliriz. Burada pandas devreye giriyor ve bu veriyi bize daha okunabilir şekilde sunma imkanı sağlıyor.

Tabiki sadece veriyi okunabilir kılması değil, veriyle işlemler yapabilme gibi imkanlarda sunuyor. Nasıl kurulduğuna ve neler yapabildiğimize bir göz atalım.

KURULUM:

Komut istemini açıp ‘pip install pandas’ yazıp kütüphaneyi indirebiliriz.

İMPORT ETME İŞLEMİ:

Projemizin başlangıç kısmına ‘import pandas as pd’ olarak yazıp ‘pd’ anahtar kelimesini kullanacağımızı söylüyoruz.

SERİ OLUŞTURMA VE BAZI ÖZELLİKLER:

Pandas’ı kurduk ve projemize import ettik. Sıra pandas Serisi oluşturmaya geldi.

İlk satırda pd.Series() metodu ile Pandas kütüphanesi içinde bir seri oluşturmak istedik ve bir dizi gönderdik. Bunu gönderdikten sonra ikinci satırda baktığımızda sonucun dizi olarak(satır şeklinde) değil sütunlu bir şekilde geldi.

Bu serinin özelliklerine bakmak gerekirse:

dtype özelliği ile serinin hangi veri tipinde olduğunu görüyoruz(int64)

size özelliği ile serinin kaç elemanı olduğunu gösterir (4 adet elemanı var)

ndim özelliği ile serinin kaç boyutta olduğunu gösterir (Bizim gönderdiğimiz seri tek boyutlu olduğu için 1 diyor)

values özelliği ile serinin içindeki değerleri gösteriyor.

index özelliği ile bir üst satırdaki serinin değerlerinin solundaki sütunu kast ediyor(0dan 4 e kadar şeklinde 4 dahil değil)

SEÇME İŞLEMİ:

Bazen yaptığımız işlerde serinin bir yerinden bir yerine kadar seçmemiz gerekebiliyor. Bu seçme işlemi nasıl yapılıyor gelin ona bir göz atalım.

‘numbers’ isimli bir dizi tanımladım ve bu dizinin içine 1 den 14 de dahil olmak üzere değerler verdim. İlerleyen süreçlerde benim bu dizideki sadece 8 tane değere ihtiyacım oldu. Bende ikinci satırdaki işlemi tanımlayıp 0’dan 8 de dahil olmak üzere 8 adet değeri seçebildim.

Peki benim bu aralıktaki 3 farkı olan sayılara ihtiyacım olduğu zaman nasıl yapabilirm ? Bununda cevabını hemen verelim.

Burada ekstra olarak bir adet daha iki nokta koyup (:) artış sayısını yazmamız yeterli.

DATAFRAME:

Pandas kütüphanesinde seri oluşturmuştuk, fakat görüntüsü bu şekilde olmamıştı. Burada pd.DataFrame() metodu ile dataframe oluşturup çok boyutlu verilerle daha kolay bi şekilde çalışabiliyoruz.

LOC ve İLOC:

Seçim işlemini Seriler üzerinde nasıl yapacağımızı görmüştük, peki iş DataFramelere(DF) gelince nasıl bir yol izlememiz gerekiyor bunu inceleyelim.

LOC metoduna geldiğimizde bu metod index mantığı ile seçim yapmaz yukarıda görüldüğü üzere 0dan başlayıp 3 de dahil olmak üzere bütün satırları alır

İLOC metoduna geldiğimizde bu metod index mantığı ile seçim yapar 0dan 3 e kadar 3dahil edilmez. Burada e kadar kısmı çok çok önemli.

Ekstra olarak loc metodu ile indexleri string olan değerleride seçebilirsiniz [‘A’:’D’] A dan D de dahil olmak üzere seçim yapabilirsiniz. Fakat iloc metodunda bu çok mümkün değil.

Evet sevgili okurlar buraya kadar Pandas kütüphanesine güzel bir giriş yaptık. Yazıların devamı için takipte kalın 🙂

Yorum bırakın