Jak exportovat pouze vybraná data do Pythonu?

C++, C#, Visual Basic, Delphi, Perl a ostatní

Moderátor: Moderátoři Živě.cz

Odeslat příspěvekod Luka35 14. 10. 2018 13:39

Ahoj, mám otázku ohledně exportu zdrojů Pythonu. Znám zdrojový kód pro kopírování celého zdrojového kódu:
Kód: Vybrat vše
import webbrowser
import urllib.request
f = urllib.request.urlopen("https://www.wikipedia.org/")
page = f.read([b]content[/b]).decode("utf-8")
f.close()
print(page)



Chtěl bych se zeptat, jak můžu vybrat část, kterou chci exportovat. Ne celý kód. Například bych exportoval (první tag) contet. Kam umístit vybraný(é) tagy (ty které chci exportovat)?
Děkuji
Lukáš
Luka35
Kolemjdoucí

Odeslat příspěvekod Jardahrou 14. 10. 2018 17:10

Použít nějakou parsovací knihovnu pro html, například Beautiful Soup (která má spoustu možností, jak něco najít nebo vybrat), načíst do ní celou stránku a pak s její pomocí vybrat části, které jsou potřeba.

Kód: Vybrat vše
import requests
from bs4 import BeautifulSoup as bs

page = requests.get("http://www.wikipedia.org").text
soup = bs(page, "html.parser")
languages = soup.select("div.langlist")

languages bude seznam obsahující tagy div s class="langlist", tj. languages[0] bude obsahovat ul obsahující odkazy jazyků s 1m+ články, languages[1] ty s 100k+ články atd.
Jardahrou
Kolemjdoucí


Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 0 návštevníků