ettorerizza
6/24/2016 - 1:54 PM

# Ce script récupère une liste de noms et vérifie d'abord s'il existent dans Wikipedia.fr, puis dans Wikipedia.nl

Ce script récupère une liste de noms et vérifie d'abord s'il existent dans Wikipedia.fr, puis dans Wikipedia.nl

# -*- coding: utf-8 -*-

######################################################
#
# Ce script récupère une liste de noms et vérifie
# d'abord s'il existent dans Wikipedia.fr, puis
# dans Wikipedia.nl
#
######################################################

import codecs
import wikipedia
# voir https://pypi.python.org/pypi/wikipedia/

with codecs.open('fichier.txt', 'r', encoding='utf-8') as f:
    lines = f.read().splitlines()

page = []

for names in lines:
    try:
        wikipedia.set_lang("fr")
        page = wikipedia.page(names, auto_suggest=True).url + " ||| " + wikipedia.page(names,                                                                                     auto_suggest=False).summary
    except:
        try:
            wikipedia.set_lang("nl")
            page = wikipedia.page(names, auto_suggest=True).url + " ||| " + wikipedia.page(names,
                                                                                            auto_suggest=False).summary
        except:
            page = "notFind " + names
    print page

with codecs.open("resultats.txt", "w", encoding='utf-8') as fp:
    for line in page:
        fp.write(line + "\n")