Page 1 of 1

[wichtig] Helfer für Auswertung der Umfrage gesucht

Posted: Sun 12. Jan 2014, 12:33
by Rey Alp
Den einzelnen Spielen müssen Erscheinungsjahr und andere Daten zugeordnert werden. Mehr dazu in diesem Thread:

Re: [wichtig] Helfer für Auswertung der Umfrage gesucht

Posted: Mon 13. Jan 2014, 12:34
by Patrik
Ich bastel gerade ein Skript, dass automatsich die Releasedaten zu den Spielen bei Wikipedia nachschlängt. Aktuell interpretiert es einfach die Umgebung der ersten vierstelligen Zahl nach dem Wort "Release" als Datum. Genutzt wird die englische Wikipedia, weil in der deutschen viel weniger Spiele einen Eintrag haben.

Code: Select all

#! /usr/bin/env python2
import re
import sys
import dateutil.parser as dparser
from urllib import urlopen

def remove_html_tags(data):
    p = re.compile(r'<.*?>')
    return p.sub(' ', data)

url = "https://en.wikipedia.org/wiki/" + sys.argv[1]

contents = urlopen(url).read()
releasepos = contents.find('Release')
releasestring = remove_html_tags(contents[releasepos:releasepos+512])

yearpos = re.search("\ \d\d\d\d\ ",releasestring)
releasedate = dparser.parse(releasestring[yearpos.start()-16:yearpos.end()-1],fuzzy=True)
print(releasedate.date())
Nutzung:

Code: Select all

$ ./gameinfo.py "The Legend of Zelda: The Wind Waker HD"
> 2013-09-20
An ner Lösung für das Genre arbeite ich noch. (Ist etwas kompliziert, weil ich eigentlich kein Python kann und fast alles nachschlagen muss…) Mir schwebt vor, mit dem Vergleich mit einer Liste an bekannten Genres zu arbeiten. Schwieriger gestaltet sich die Abfrage der Freigaben: Das USK-Rating steht (aus nachvollziehbaren Gründen) nicht auf der englischen Wikipedia und die deutsche hat wie gesagt nur sehr begrenzt Einträge für Spiele.

2Do:
  • Fehlerbehandlung, z.B. bei nicht auffindbaren Daten
  • Informationen über Genre und Altersfreigabe

Re: [wichtig] Helfer für Auswertung der Umfrage gesucht

Posted: Mon 13. Jan 2014, 13:02
by Rey Alp
Kannst du wegen der Freigaben nicht einfach die usk-Datenbank durchsuchen lassen? Ansonsten muss man noch herausfinden, ob es verkauft, abonniert, free2play oder freeware ist.

Vielleich thilft auch dies:
- http://ogdb.eu/index.php?section=titleslist&show=number