Utente:SkyBot/Lista di esclusione

Da Wikiversità, l'apprendimento libero.
#
# This page is read by bots that find copyright violations and use it
# to ignore not interesting URLs. You can place here part of URLs that
# are to reject. If unsure, please use the talk page.
#
# You could also consider to report SPAM to:
#
#    http://www.google.com/contact/spamreport.html
#    http://add.yahoo.com/fast/help/us/ysearch/cgi_reportsearchspam
#
# Please inform about mirrors and forks of Wikipedia to:
#
#    http://en.wikipedia.org/wiki/Wikipedia:Mirrors_and_forks
#
# or equivalent page in others Wikipedia according to language
# used by the clone.
#

#
# 

italian.words
words.italian

the-planets.com # lots of copyright violations

#
#
# SPAM
#

1978-ford.info
100-mortgage.info
100-pro.info
100fm.info
1051.info
10baset.info
10k-gold.info
12-volt-coffee-maker.info
12-year.info
120-film.info
120-volt.info
120t.info
128-mb.info
128mb.info
128-memory-stick.info
12v-air-compressor.info
13-original.info
1320-kfan.info
14k-gold.info
14th-amendment.info
14th-century.info
1600x1200.info
16th-century.info
17-inch.info
18-ans.info
18-lcd.info
18-wheeler-american-pro-trucker.info
18-wheels.info
180sx.info
18th-century-costume.info
19-inch-rack.info
1901-census.info
1930-fashion.info
1935-chevrolet.info
20of100c.info
23to23.info
39-of-100.info
95mb.com
of100b.info # 47of100b.info, 53of100b.info, 90of100b.info
of100c.info
of100e.info
of100d.info
a-life-coach-in-the-uk.info
about-gasoline-alley.info
adventure-auction.com
affordablehealing.info
after-gasoline-alley.info
air-jordan.info
air-treatment.info
alfred-hitch-covers.info
anna-sui-apple.info
articles-by-ken-blanchard.info
articles-on-stress-of.info
assessment-development-training.info
athletic-director-handbook.info
articles-on-parenting.info
athletic-coaching-salaries.info
athletic-administration.info
beach-wear.info    
bestfreeclub.info
boys-size.info
dotpulse.it
webbox180.server-home.org #web734.webbox180.server-home.org
webbox240.server-home.org #web190.webbox240.server-home.org
web5382.server75.greatnet.de
little-asian-teen.com
touristtraveldestinations.com
loveisanoption.com
notbeer.com
ftppro.com/library
freewebs.com/techtrupp
isolafelice.info
multipletopics.com
ips-networking.com
locode.usiow.en.pdabuy.org
teknoser.it #spam
prostatecancercheck.com
cloakingfordummies.com
istheplan.info
it.geocities.com/movilinzo
criticalassets.com
xxxx.com
dictors.net # en.dictors.net/73/82247.html
casinowiz.com # spam
.findwebs.ru # spam (gopa11.findwebs.ru, zapas20.findwebs.ru...)
tuttosulgsm.com # /riassunti-libri/riassunto_metamorfosi_kafka.html
lampedusalidoazzurro.it # www.lampedusalidoazzurro.it/pag_ge.asp?lingua=ita&link=24
disk-data-recovery-services.com # http://www.disk-data-recovery-services.com/cd-data-rescue-serial-number.aspx
encyclopediahome.com
high-tensile-strength.highyieldaccount.org # http://high-tensile-strength.highyieldaccount.org/flexural-strength
bigbingonews.com # http://www.bigbingonews.com/wiki/?title=Edain
bingositeslist.com # http://www.bingositeslist.com/wiki/?title=Urheimat
bingobestplayers.com # http://www.bingobestplayers.com/wiki/?title=Urheimat
toptraveleasterneurope.com # http://www.toptraveleasterneurope.com/wiki/?title=Urheimat
virginia-homeimprovementloan.com # http://www.virginia-homeimprovementloan.com/wiki/?title=Urheimat
totallyfreebabystuff101.com # http://www.totallyfreebabystuff101.com/wiki/?title=Hamshenis
russian-women-pics
average-joe.info
rubylq2.com # online-jobs.rubylq2.com, pregnancy-advice.rubylq2.com, cheap-cars-and-homes.rubylq2.com
portofino.ws # ampi copia e incolla di testi di it.wiki 
casinostreak.com # http://www.casinostreak.com/article_Petersburg_paradox
php-deluxe.net/encyclopedia, # http://www.php-deluxe.net/encyclopedia,index.page,Volume-computing.htm alcune pagine copiate da en.wiki
sexytonesforphones.com # spam
specialist-data-recovery.com # http://www.specialist-data-recovery.com/company-data-in-management-uk.aspx
mediavision-data-recovery.com
www.mediashopping.info #http://www.mediashopping.info/computers.htm
geocities.com/ringdidong
interactglobalinfo.info
interactglobalbroadcast.info
interactglobalhardnews.info
interactglobalintelligence.info

topicscontent.be
wikiit.cdk.pl
yourtime.it

#
# Cloni
#
# Puoi segnalare nuovi cloni di Wikipedia qui:
# http://en.wikipedia.org/wiki/Wikipedia:Mirrors_and_forks
# http://it.wikipedia.org/wiki/Wikipedia:Cloni

indexsuche.com # http://www.indexsuche.com/Edain.html (no mention of 'Wikipedia')
wiki.lawguru.com # http://wiki.lawguru.com/index.php/United_States_Code (no mention of 'Wikipedia')

vacanzalastminute.com # clone irregolare di it.wiki
cantanti.it # it.wiki clone non conforme
cittanelmondo. # (.net o .com) wikipedia clone da segnalare, conformita' pessima
statinelmondo. # (.net o .com) wikipedia clone da segnalare, conformita' pessima / inviata email
it.science24.org # it.wiki clone segnalabile
redhostingdns.com # it.wiki clone da segnalare, scarse indicazioni di provenienza, no GNU FDL
esopedia.it # clone da segnalare, indicata licenza ma non provenienza da Wikipedia
myclassiclyrics.com # en.wiki, only 'GNU FDL'
wacklepedia.com # en.wiki, only 'GNU FDL'
music.musictnt.com # en.wiki
wapedia.mobi # international wiki clone
experiencefestival.com # Lots of "adapted Wikipedia article" 
tolkiengateway.net/wiki # 'FDL', not 'Wikipedia'
100cia.com/enciclopedia # es.wiki clone
tocatch.info # en.wiki clone
stabiaenjoy.com #
en.askmore.net # GNU FDL, not 'Wikipedia'
oroscopogratis.net # copie di pagine di it.wiki, conformita' pessima
magiabianca.info # come sopra
tarocchigratis.net # come sopra
cartomanzia-tarocchi.info # come sopra
cartomanzia24.com # come sopra
tarocchiamore.info # come sopra
ritimagici.info # come sopra
hechizos.info # come sopra
psychology.wikia.com
economicexpert.com # en.wiki clone conforme
kidneypussycat.splinder.com
it.askmore.net #clone, citata FDL, no Wikipedia
girlpower.it # uno o piu' testi copiati e nessun recapito disponibile
ininternet.org # clone di it.wiki, in via di regolarizzazione
ceramicacerasella.it # it.wiki clone conforme (indicazioni complete in fondo)
meridianoscuola.it # it.wiki clone conforme (indicazioni complete in fondo)
torredibabele.it # it.wiki clone conforme (indicazioni complete in fondo)
iask123.info # http://www.iask123.info/it/Lete_(mitologia_romana).htm
encyclopedia.figureout.info
allexperts.com # http://en.allexperts.com/e/m/me/mercenaries:_playground_of_destruction.htm
taxglosses.com # http://www.taxglosses.com/Brown-to-Caigs/Bess.html
http://www.hair-of-style.com/asearch/ # clone regolare, ma la funzione di ricerca non cita Wikipedia
#alberghitalia.com
#alberghi.com/Provincia/Aosta/Index.asp
costaetruscaweb.com # copie di testi di it.wiki, richiesta citazione
hotel-berlino.com
#informagiovani-italia.com spam? email
englishgratis.com # testi di it.wiki o clone conforme da segnalare eventualmente
www.kopete.org # http://www.kopete.org/Erbium-doped-fiber-amplifier.html
www.joujou.org/dueinconsolabili # hanno copiato da varie pagine di it.wiki (Atari, Console...)
drhouseitalia.altervista.org # vari testi copiati da it.wiki
msn988.info # ci cita correttamente in fondo
www.1bx.com # Clone, ci cita correttamente in fondo
www.cat-5-sources.info
artistbooking # testi di en.wiki, email inviata
www.tvave.com # testi di en.wiki, email non ancora inviata
www.julie1964.com # testi di en.wiki, email non ancora inviata
webraindor.info # testi di en.wiki, email non ancora inviata
www.seniorfitness.com # testi di en.wiki, email non ancora inviata
articles.gourt.com #clone, ci cita correttamente
www.iskenderiye.net/www_it #clone non conforme, neanche formattato

#
#
# Testi di pubblico dominio o fonti coperte da licenza GNU FDL
# (l'attribuzione è comunque dovuta, quindi semplici copia e incolla
# che fanno pensare che l'autore del testo sia diverso da quanto risulta
# nell'originale è una situazione che merita una correzione)
#

#1911encyclopedia.org # 1911 texts
#bartleby.com/107 # Henry Gray (1821-1865).  Anatomy of the Human Body
##academickids.com/encyclopedia GNU FDL text
#pcg-portal.com # GNU FDL texts
#ghr.nlm.nih.gov # PD texts
www.mysticgames.com/EditCelebs.cfm?ID= # pagina di modifica di un sito ok

#
#
# Autorizzate
#

comune.storo.tn.it
tifo-e-amicizia.it
grotteriaonline.com
solfano.it/canicatti
agidi.it
hockeytime.net
cuoa.it
palazzojatta.org
alliste.eu
donnalucata.it 
hypertrek.info # anche rilasciati sotto GNU FDL (ma manca spesso una citazione del sito)
mariolodi.it
novazzano.ch
webalice.it/antoniomontanari1/quantestorie/qs.0002.html # OTRS #2007010810010656
comune.rimini.it/cultura/biblioteca/gambalunga/gamba_index.htm # OTRS #2007010810010656
comune.rimini.it/servizi/citta/cultura/biblioteca/-storia/pagina12596.html  # OTRS #2007010810010656
racine.ra.it/ginanni/centro_documentazione/progetti_prodotti/aree_di_progetto/area_prog_5bm_05_06/turismo/mass/la%20biblioteca%20gambalunghiana.htm # OTRS #2007010810010656
mariobiondi.net # OTRS #2006090510011273
fondazionepergolesispontini.com # 2007011110015798
aecaosta.it # 2007012810011162
www.montelepre.info # 2006062210010121
www.firenze.net/turismo/cm_dettaglio.wbs?id_contenuto=4342&id_categorie=37&turismo=c2f39f354ec8731a0111db72d05447d5 #2006051010009863
verona.itinerarionline.it/sacro_cuore_sc_4734.htm #2006051010009863
www.gotuscany.it/turismo/cm_dettaglio.wbs?id_contenuto=4342&id_categorie=37 #2006051010009863
www.guida.firenze.it/sacro_cuore_sc_4734.htm #2006051010009863
www.tuttoparma.com/sacro_cuore_sc_4734.htm #2006051010009863
www.tuttosalerno.com/sacro_cuore_sc_4734.htm #2006051010009863
verona.itinerarionline.it/sacro_cuore_sc_4734.htm #2006051010009863
www.gotuscany.it/turismo/cm_dettaglio.wbs?id_contenuto=4342&id_categorie=37 #2006051010009863
www.guida.firenze.it/sacro_cuore_sc_4734.htm #2006051010009863
www.tuttoparma.com/sacro_cuore_sc_4734.htm #2006051010009863
www.tuttosalerno.com/sacro_cuore_sc_4734.htm #2006051010009863
web.rete.toscana.it/Fede/ricerca.jsp #2006051010009863
www.comune.pisa.it/turismo/itinerari #2006051010009863
www.ilnavicello.it/scali/piagge.php #2006051010009863
www.saimicadove.it/turismo/articolo.asp?Id=5802 #2006051010009863
www.stilepisano.it/immagini #2006051010009863
galluzzo.it #2006120910012633
biblico.it #2007020710013224, http://www.biblico.it/defunti/rip_alonso.html
www.cittaelettriche.it/ettom.htm #2006082610004725
www.irolli.it # 2007012910016834
www.house-md.info #2007021610000908
telefilm-fan-forum.cmsite.tv/episodi-1x03-1x04-t2781.html #2007021610000908
drunken-butterfly.com/pag_1.htm #2007021610006199
profile.myspace.com/index.cfm?fuseaction=user.viewprofile&friendid=62888050 #2007021610006199
www.galluccifausto.it/papanice/site/storia.htm #2006042710010849
www.psicolinea.it #2006060910007901
www.centromethod.it #2006060910007901
www.kwsalute.kataweb.it/Notizia/0,1044,4719,00.html #2006060910007901
www.luccaedintorni.it/chiese #2006051010009863
web.rete.toscana.it/Fede/luogo.jsp?identificativo= #2006051010009863
www.comune.castiglionfiorentino.ar.it/storia_palio.asp #2007022610025104
www.terziereportafiorentina.it #2007022610025104
digilander.libero.it/castrolibero #2007020310008149
italiasalute.leonardo.it/News.asp?ID=7123 #2006060910007901
wai.scuolaer.it/page.asp?idcategoria=129&idsezione=380&id=53961 #2006060910007901
www.comunicati-stampa.net/com/cs-1117/La_scuola:_che_fatica!_Ma_vediamone_le_cause #2006060910007901
www.giuramento.it/content/view/58/70 #2006060910007901
www.kwsalute.kataweb.it/Notizia/0,1044,4867,00.html #2006060910007901
www.scuolaer.it/page.asp?IDCategoria=129&IDSezione=380&ID=53961 #2006060910007901
www.scuolaer.it/stampabile.asp?IDCategoria=129&IDSezione=380&ID=53961 #2006060910007901
segnalazioni.blogspot.com/2005_03_06_archive.html #2006060910007901
www.comunicati-stampa.net/com/cs-1533/La_dislessia #2006060910007901
www.kwsalute.kataweb.it/Notizia/0,1044,4763,00.html #2006060910007901
www.scuolaer.it/allegato.asp?ID=197230 #2006060910007901
www.demonilla.it #2007071710010173
www.tuscany-villas.it #(copia da 2006051010009863)