Szerkesztő:Python/mymod

A Wikiszótárból, a nyitott szótárból
#!/usr/bin/python
import os
import sys
import re

country =  'Djibouti'
orszag = 'Dzsibuti'
abbr = 'Md'

#print country
#command = 'wget http://en.wikipedia.org/wiki/%s' % country
#print command
#os.system(command)
#os.system('mv %s tmp' % country)

szotar=[
    ('Official language]]s','Hivatalos nyelv]]ek'),
    ('Official language','Hivatalos nyelv'),
    ('[[Language]]s', '[[Hivatalos nyelv]]'),
    ('None', 'nincs'),
    ('In detail', '{{PAGENAME}} zászlaja'),
    ('In Detail', '{{PAGENAME}} zászlaja'),
    ('Full size', '{{PAGENAME}} címere'),
    ('language', 'nyelv'),
    ('National [[motto]]', '[[Nemzeti mottók listája|Mottó]]'),
    ('[[National motto]]', '[[Nemzeti mottók listája|Mottó]]'),
    ('[[List of state mottos|National motto]]', '[[Mottó]]'),
    ('[[Capital]] and largest city', '[[Főváros]] és legnagyobb város'),
    ('s [[coordinate]]s', ' koordinátái'),
    ('[[Coordinates]]', 'Koordinátái'),  
    ('Image', 'Kép'),
    ('Great Britain', 'Nagy-Britannia'),
    ('image', 'Kép'),
    ('List of countries by area', 'Országok terület szerinti listája'),
    ('List of countries by population', 'Országok népesség szerinti listája'),
    ('List of countries by GDP', 'Országok GDP szerinti listája'),    
    ('Capital', 'Főváros'),
    ('Establishment', 'Alapítás'),
    ('Independence', 'Függetlenség'),
    ('Gross Domestic Product|GDP', 'Bruttó nemzeti össztermék|GDP'),
    ('Capital', 'Főváros'),
    ('Largest City', 'Legnagyobb város'),
    ('Monarch', 'Király'),
    ('President', 'Elnök'),
    ('Chancellor', 'Kancellár'),
    ('Prime minister', 'Miniszterelnök'),
    ('Prime Minister', 'Miniszterelnök'),
    ('Area', 'Terület'),
    ('United Kingdom', 'Egyesült Királyság'),
    ('Total', 'Teljes'),
    ('square kilometre|km&sup2', 'km&sup2'),    
    ('% water', 'ebből víz'),
    ('Population density|Density', 'Népsűrűség'),
    ('Density', 'Népsűrűség'),
    ('Population', 'Népesség'),
    ('Currency', 'Pénznem'),
    ('euro coins', 'euró érmék'),
    ('Time zone', 'Időzóna'),
    ('Daylight saving time|summer', 'nyári időszámítás|nyár'),
    ('National anthem', 'Nemzeti himnusz|Himnusz'),
    ('Coordinated Universal Time|UTC', 'Egyezményes világidő|UTC'),
    ('Top-level domain|Internet TLD', 'Legfelső szintű tartomány|TLD'),
    ('List_of_country_calling_codes|Calling Code', 'Országhívókódok listája|Hívókód'),
    ('List of country calling codes|Calling Code', 'Országhívókódok listája|Hívókód'),
    ]

months='''January Január
February Február
March Március
April Április
May Május
June Június
July Július
August Augusztus
September Szeptember
October Október
November November
December December'''

words ='''
Germany Németország
German német
Greek görög
English angol
Germany Németország
Date Dátuma
head fő
none nincs
Spanish spanyol
French francia
Arabic arab
billion mrd
France Franciaország
Negligible elhanyagolható
Spain Spanyolország
United Egyesült
Size zászlaja
Detail Címere
Kingdom Királyság
Independence Függetlenség
Russian orosz
Russia Oroszország
Declared Kikiáltva
Recognised Elismerve
King Király
king Király
queen Királynő
Queen Királynő
'''

words += months

words = words.strip()

word_list = words.split('\n')
word_list = [x.split(' ') for x in word_list]
print word_list
szotar.extend(word_list)


f = open('tmp.txt', 'r')
lines=f.readlines()
nlines=[]
f.close()

for line in lines:
    newline = line
    print line,
    newline = re.sub(r'Flag of [A-Za-z ]*', '%s zászlaja' % orszag , newline)
    newline = re.sub(r'Coat of [Aa]rms of [A-Za-z ]*', '%s címere' % orszag , newline)
    newline = re.sub(r'President of [A-Za-z ]*', '%s elnöke' % orszag , newline)
    newline = re.sub(r'Prime [Mm]inister of [A-Za-z ]*', '%s miniszterelnöke' % orszag, newline)

    regexpr = r'Ranked (\d*)[a-z]*'
    rank = re.search(regexpr, newline)
    if rank:
	rank = rank.group(1)
	newline = re.sub(regexpr, '%s.' % rank , newline)

    regexpr = r'World ranking: (\d*)[a-z]*'
    rank = re.search(regexpr, newline)
    if rank:
	#print 2, newline
	print rank.groups()
	rank = rank.group(1)
	newline = re.sub(regexpr, '%s.' % rank , newline)
	#print 3, newline
    for en, hu in szotar:
	newline = newline.replace(en, hu)
    print newline
    nlines.append(newline)

nlines.append('''

[[Kép:%s-terkep.png|thumb|%s térképe]]



{{afrika}}

[[en:%s]]
''' % (abbr,  orszag, country) )

print "** %s" % nlines[-5:]

f = open('tmp2.txt', 'w')
f.writelines(nlines)
f.close()