PYTHON İLE SİTEDEN VERİ ÇEKME

Sevgili okurlar hepinize merhaba,

Bugün sizlere Python ile bir websitesinden nasıl veri çekebiliriz,hangi kütüphaneleri kullanmamız gerekir,onu anlatmaya çalışacağım.

Öncelikle kullanacağımız kütüphaneleri yazarak başlamak istiyorum:

  • Requests
  • BeautifulSoup4

Kullanacağımız kütüphaneler bunlar. İsterseniz bunları nasıl yükleyebileceğimizle başlayalım.

 

  1. Başlangıç çubuğuna “cmd” yazıp sağ tıklayıp yönetici olarak çalıştırınız.
  2. Açılan ekranda “pip install beautifulsoup4” yazınız

4.Aynı şekilde requests kütüphanemizi yüklemek içinde cmd’yi açıp “pip install requests” yazıyoruz ve ufak bir indirme işleminden sonra yüklenmiş oluyor.

ŞİMDİ UFAK UFAK BİR SİTEDEN VERİ ÇEKME İŞLEMİNE GEÇELİM

Benim veri çekeceğim site Türkiye’nin en büyük şirketlerinin sıralaması olan https://www.capital.com.tr/listeler/capital-500sitesi

Başlamadan önce bu yüklemiş olduğumuz kütüphaneleri kodumuza eklememiz gerekiyor.

import ile kütüphanelerimiz içindeki komutları kullanmak istediğimizi belirtiyoruz.

İlk olarak burada gördüğünüz üzere veri çekmek istediğimiz siteyi “url” kolaylık olması açısından url adında bir değişkene atadım.

İkinci olarak ise yüklemiş olduğum requests kütüphanesi ile kullandığım “get” komutu ile bu siteden veri çekmek istediğimi belirttim

Requests ile ben verileri çektim fakat benim ihtiyacım olan şey web sitesinin kaynağı olduğu için “html_icerik” değiskeniyle birlikte web sayfasının kaynağını alıyorum.

En sonda görmüş olduğunuz “soup” değişkeni ile ise benim bu websiteden çekmiş olduğum veriyi parçalamak istediğimi belirtiyorum.

Bu görmüş olduğunuz ss lerden alttaki veriyi çekmiş olduğum sitenin “sayfa kaynağı”dır. Sayfa kaynağına ulaşmak için sitenin boş bir yerinde sağ tık yapıp sayfa kaynağını görüntüle diyebilirsiniz.

Kodun bu kısmında “name”,”city”ve”working” adında 3 adet değişkenim var. Bunları beautifulsoup4’ün komutu olan “find_all” ile çekiyorum.

Burada “find_all” komutundan sonra neye göre yazdığımızı şöyle açıklayayım.

soup.find_all(“mavi_ile_çizilen_yer”,{“kırmızı_ile_çizilen_yer”:”siyah_ile_çizilen_yer”})   diyebiliriz.

Son olarak bir for döngüsü içinde belirlemiş olduğum “i,j,k” değişkenlerini “text”ine eşitleyip format ile yazdırıyorum.

Son olarak ise böyle bir çıktı ile karşılaşıyoruz.

 

Okuduğunuz için çok teşekkürler.

Python’la kalın….

 

 

Yorum bırakın