Utente:SkyBot/Lista di esclusione
Aspetto
# # This page is read by bots that find copyright violations and use it # to ignore not interesting URLs. You can place here part of URLs that # are to reject. If unsure, please use the talk page. # # You could also consider to report SPAM to: # # http://www.google.com/contact/spamreport.html # http://add.yahoo.com/fast/help/us/ysearch/cgi_reportsearchspam # # Please inform about mirrors and forks of Wikipedia to: # # http://en.wikipedia.org/wiki/Wikipedia:Mirrors_and_forks # # or equivalent page in others Wikipedia according to language # used by the clone. # # # italian.words words.italian the-planets.com # lots of copyright violations # # # SPAM # 1978-ford.info 100-mortgage.info 100-pro.info 100fm.info 1051.info 10baset.info 10k-gold.info 12-volt-coffee-maker.info 12-year.info 120-film.info 120-volt.info 120t.info 128-mb.info 128mb.info 128-memory-stick.info 12v-air-compressor.info 13-original.info 1320-kfan.info 14k-gold.info 14th-amendment.info 14th-century.info 1600x1200.info 16th-century.info 17-inch.info 18-ans.info 18-lcd.info 18-wheeler-american-pro-trucker.info 18-wheels.info 180sx.info 18th-century-costume.info 19-inch-rack.info 1901-census.info 1930-fashion.info 1935-chevrolet.info 20of100c.info 23to23.info 39-of-100.info 95mb.com of100b.info # 47of100b.info, 53of100b.info, 90of100b.info of100c.info of100e.info of100d.info a-life-coach-in-the-uk.info about-gasoline-alley.info adventure-auction.com affordablehealing.info after-gasoline-alley.info air-jordan.info air-treatment.info alfred-hitch-covers.info anna-sui-apple.info articles-by-ken-blanchard.info articles-on-stress-of.info assessment-development-training.info athletic-director-handbook.info articles-on-parenting.info athletic-coaching-salaries.info athletic-administration.info beach-wear.info bestfreeclub.info boys-size.info dotpulse.it webbox180.server-home.org #web734.webbox180.server-home.org webbox240.server-home.org #web190.webbox240.server-home.org web5382.server75.greatnet.de little-asian-teen.com touristtraveldestinations.com loveisanoption.com notbeer.com ftppro.com/library freewebs.com/techtrupp isolafelice.info multipletopics.com ips-networking.com locode.usiow.en.pdabuy.org teknoser.it #spam prostatecancercheck.com cloakingfordummies.com istheplan.info it.geocities.com/movilinzo criticalassets.com xxxx.com dictors.net # en.dictors.net/73/82247.html casinowiz.com # spam .findwebs.ru # spam (gopa11.findwebs.ru, zapas20.findwebs.ru...) tuttosulgsm.com # /riassunti-libri/riassunto_metamorfosi_kafka.html lampedusalidoazzurro.it # www.lampedusalidoazzurro.it/pag_ge.asp?lingua=ita&link=24 disk-data-recovery-services.com # http://www.disk-data-recovery-services.com/cd-data-rescue-serial-number.aspx encyclopediahome.com high-tensile-strength.highyieldaccount.org # http://high-tensile-strength.highyieldaccount.org/flexural-strength bigbingonews.com # http://www.bigbingonews.com/wiki/?title=Edain bingositeslist.com # http://www.bingositeslist.com/wiki/?title=Urheimat bingobestplayers.com # http://www.bingobestplayers.com/wiki/?title=Urheimat toptraveleasterneurope.com # http://www.toptraveleasterneurope.com/wiki/?title=Urheimat virginia-homeimprovementloan.com # http://www.virginia-homeimprovementloan.com/wiki/?title=Urheimat totallyfreebabystuff101.com # http://www.totallyfreebabystuff101.com/wiki/?title=Hamshenis russian-women-pics average-joe.info rubylq2.com # online-jobs.rubylq2.com, pregnancy-advice.rubylq2.com, cheap-cars-and-homes.rubylq2.com portofino.ws # ampi copia e incolla di testi di it.wiki casinostreak.com # http://www.casinostreak.com/article_Petersburg_paradox php-deluxe.net/encyclopedia, # http://www.php-deluxe.net/encyclopedia,index.page,Volume-computing.htm alcune pagine copiate da en.wiki sexytonesforphones.com # spam specialist-data-recovery.com # http://www.specialist-data-recovery.com/company-data-in-management-uk.aspx mediavision-data-recovery.com www.mediashopping.info #http://www.mediashopping.info/computers.htm geocities.com/ringdidong interactglobalinfo.info interactglobalbroadcast.info interactglobalhardnews.info interactglobalintelligence.info topicscontent.be wikiit.cdk.pl yourtime.it # # Cloni # # Puoi segnalare nuovi cloni di Wikipedia qui: # http://en.wikipedia.org/wiki/Wikipedia:Mirrors_and_forks # http://it.wikipedia.org/wiki/Wikipedia:Cloni indexsuche.com # http://www.indexsuche.com/Edain.html (no mention of 'Wikipedia') wiki.lawguru.com # http://wiki.lawguru.com/index.php/United_States_Code (no mention of 'Wikipedia') vacanzalastminute.com # clone irregolare di it.wiki cantanti.it # it.wiki clone non conforme cittanelmondo. # (.net o .com) wikipedia clone da segnalare, conformita' pessima statinelmondo. # (.net o .com) wikipedia clone da segnalare, conformita' pessima / inviata email it.science24.org # it.wiki clone segnalabile redhostingdns.com # it.wiki clone da segnalare, scarse indicazioni di provenienza, no GNU FDL esopedia.it # clone da segnalare, indicata licenza ma non provenienza da Wikipedia myclassiclyrics.com # en.wiki, only 'GNU FDL' wacklepedia.com # en.wiki, only 'GNU FDL' music.musictnt.com # en.wiki wapedia.mobi # international wiki clone experiencefestival.com # Lots of "adapted Wikipedia article" tolkiengateway.net/wiki # 'FDL', not 'Wikipedia' 100cia.com/enciclopedia # es.wiki clone tocatch.info # en.wiki clone stabiaenjoy.com # en.askmore.net # GNU FDL, not 'Wikipedia' oroscopogratis.net # copie di pagine di it.wiki, conformita' pessima magiabianca.info # come sopra tarocchigratis.net # come sopra cartomanzia-tarocchi.info # come sopra cartomanzia24.com # come sopra tarocchiamore.info # come sopra ritimagici.info # come sopra hechizos.info # come sopra psychology.wikia.com economicexpert.com # en.wiki clone conforme kidneypussycat.splinder.com it.askmore.net #clone, citata FDL, no Wikipedia girlpower.it # uno o piu' testi copiati e nessun recapito disponibile ininternet.org # clone di it.wiki, in via di regolarizzazione ceramicacerasella.it # it.wiki clone conforme (indicazioni complete in fondo) meridianoscuola.it # it.wiki clone conforme (indicazioni complete in fondo) torredibabele.it # it.wiki clone conforme (indicazioni complete in fondo) iask123.info # http://www.iask123.info/it/Lete_(mitologia_romana).htm encyclopedia.figureout.info allexperts.com # http://en.allexperts.com/e/m/me/mercenaries:_playground_of_destruction.htm taxglosses.com # http://www.taxglosses.com/Brown-to-Caigs/Bess.html http://www.hair-of-style.com/asearch/ # clone regolare, ma la funzione di ricerca non cita Wikipedia #alberghitalia.com #alberghi.com/Provincia/Aosta/Index.asp costaetruscaweb.com # copie di testi di it.wiki, richiesta citazione hotel-berlino.com #informagiovani-italia.com spam? email englishgratis.com # testi di it.wiki o clone conforme da segnalare eventualmente www.kopete.org # http://www.kopete.org/Erbium-doped-fiber-amplifier.html www.joujou.org/dueinconsolabili # hanno copiato da varie pagine di it.wiki (Atari, Console...) drhouseitalia.altervista.org # vari testi copiati da it.wiki msn988.info # ci cita correttamente in fondo www.1bx.com # Clone, ci cita correttamente in fondo www.cat-5-sources.info artistbooking # testi di en.wiki, email inviata www.tvave.com # testi di en.wiki, email non ancora inviata www.julie1964.com # testi di en.wiki, email non ancora inviata webraindor.info # testi di en.wiki, email non ancora inviata www.seniorfitness.com # testi di en.wiki, email non ancora inviata articles.gourt.com #clone, ci cita correttamente www.iskenderiye.net/www_it #clone non conforme, neanche formattato # # # Testi di pubblico dominio o fonti coperte da licenza GNU FDL # (l'attribuzione è comunque dovuta, quindi semplici copia e incolla # che fanno pensare che l'autore del testo sia diverso da quanto risulta # nell'originale è una situazione che merita una correzione) # #1911encyclopedia.org # 1911 texts #bartleby.com/107 # Henry Gray (1821-1865). Anatomy of the Human Body ##academickids.com/encyclopedia GNU FDL text #pcg-portal.com # GNU FDL texts #ghr.nlm.nih.gov # PD texts www.mysticgames.com/EditCelebs.cfm?ID= # pagina di modifica di un sito ok # # # Autorizzate # comune.storo.tn.it tifo-e-amicizia.it grotteriaonline.com solfano.it/canicatti agidi.it hockeytime.net cuoa.it palazzojatta.org alliste.eu donnalucata.it hypertrek.info # anche rilasciati sotto GNU FDL (ma manca spesso una citazione del sito) mariolodi.it novazzano.ch webalice.it/antoniomontanari1/quantestorie/qs.0002.html # OTRS #2007010810010656 comune.rimini.it/cultura/biblioteca/gambalunga/gamba_index.htm # OTRS #2007010810010656 comune.rimini.it/servizi/citta/cultura/biblioteca/-storia/pagina12596.html # OTRS #2007010810010656 racine.ra.it/ginanni/centro_documentazione/progetti_prodotti/aree_di_progetto/area_prog_5bm_05_06/turismo/mass/la%20biblioteca%20gambalunghiana.htm # OTRS #2007010810010656 mariobiondi.net # OTRS #2006090510011273 fondazionepergolesispontini.com # 2007011110015798 aecaosta.it # 2007012810011162 www.montelepre.info # 2006062210010121 www.firenze.net/turismo/cm_dettaglio.wbs?id_contenuto=4342&id_categorie=37&turismo=c2f39f354ec8731a0111db72d05447d5 #2006051010009863 verona.itinerarionline.it/sacro_cuore_sc_4734.htm #2006051010009863 www.gotuscany.it/turismo/cm_dettaglio.wbs?id_contenuto=4342&id_categorie=37 #2006051010009863 www.guida.firenze.it/sacro_cuore_sc_4734.htm #2006051010009863 www.tuttoparma.com/sacro_cuore_sc_4734.htm #2006051010009863 www.tuttosalerno.com/sacro_cuore_sc_4734.htm #2006051010009863 verona.itinerarionline.it/sacro_cuore_sc_4734.htm #2006051010009863 www.gotuscany.it/turismo/cm_dettaglio.wbs?id_contenuto=4342&id_categorie=37 #2006051010009863 www.guida.firenze.it/sacro_cuore_sc_4734.htm #2006051010009863 www.tuttoparma.com/sacro_cuore_sc_4734.htm #2006051010009863 www.tuttosalerno.com/sacro_cuore_sc_4734.htm #2006051010009863 web.rete.toscana.it/Fede/ricerca.jsp #2006051010009863 www.comune.pisa.it/turismo/itinerari #2006051010009863 www.ilnavicello.it/scali/piagge.php #2006051010009863 www.saimicadove.it/turismo/articolo.asp?Id=5802 #2006051010009863 www.stilepisano.it/immagini #2006051010009863 galluzzo.it #2006120910012633 biblico.it #2007020710013224, http://www.biblico.it/defunti/rip_alonso.html www.cittaelettriche.it/ettom.htm #2006082610004725 www.irolli.it # 2007012910016834 www.house-md.info #2007021610000908 telefilm-fan-forum.cmsite.tv/episodi-1x03-1x04-t2781.html #2007021610000908 drunken-butterfly.com/pag_1.htm #2007021610006199 profile.myspace.com/index.cfm?fuseaction=user.viewprofile&friendid=62888050 #2007021610006199 www.galluccifausto.it/papanice/site/storia.htm #2006042710010849 www.psicolinea.it #2006060910007901 www.centromethod.it #2006060910007901 www.kwsalute.kataweb.it/Notizia/0,1044,4719,00.html #2006060910007901 www.luccaedintorni.it/chiese #2006051010009863 web.rete.toscana.it/Fede/luogo.jsp?identificativo= #2006051010009863 www.comune.castiglionfiorentino.ar.it/storia_palio.asp #2007022610025104 www.terziereportafiorentina.it #2007022610025104 digilander.libero.it/castrolibero #2007020310008149 italiasalute.leonardo.it/News.asp?ID=7123 #2006060910007901 wai.scuolaer.it/page.asp?idcategoria=129&idsezione=380&id=53961 #2006060910007901 www.comunicati-stampa.net/com/cs-1117/La_scuola:_che_fatica!_Ma_vediamone_le_cause #2006060910007901 www.giuramento.it/content/view/58/70 #2006060910007901 www.kwsalute.kataweb.it/Notizia/0,1044,4867,00.html #2006060910007901 www.scuolaer.it/page.asp?IDCategoria=129&IDSezione=380&ID=53961 #2006060910007901 www.scuolaer.it/stampabile.asp?IDCategoria=129&IDSezione=380&ID=53961 #2006060910007901 segnalazioni.blogspot.com/2005_03_06_archive.html #2006060910007901 www.comunicati-stampa.net/com/cs-1533/La_dislessia #2006060910007901 www.kwsalute.kataweb.it/Notizia/0,1044,4763,00.html #2006060910007901 www.scuolaer.it/allegato.asp?ID=197230 #2006060910007901 www.demonilla.it #2007071710010173 www.tuscany-villas.it #(copia da 2006051010009863)