Testi in giapponese e cinese nei risultati di ricerca Google? Aiuto!

Testi in giapponese e cinese nei risultati di ricerca Google? Aiuto!

  • Seo
  • 21 giugno 2022
Indice dei contenuti

Recentemente ho avuto un problema con il sito di un cliente. I risultati di ricerca Google contenevano caratteri in giapponese o cinese. Era evidente che il sito era stato Hackerato. Facendo una ricerca nel database non risultavano i testi. Dunque Google da dove prendeva questi testi? Perchè non c’era traccia delle tringhe cinesi nel DB o nelle cartelle sul server? La risposta è molto semplice tutti i dati dei testi erano criptati dentro file posizionati nelle directory del server. Il sito era stato Hackerato.

Come potevano apparire nelle ricerche i caratteri Cinesi senza essere nel DB?

Qui sotto vedete un’immagine di un file con un codice incomprensibile e lunghissimo. Ho trovato diversi file nella root con codice criptato come questo e avendo esperienza dei nomi dei file di Joomla o Wordpress mi sono balzati subito all’occhio. Così ho potuto fare una ricerca all’interno dei file della stringa “base64_decode” e trovare tutti i file che ne facevano un uso malevolo (facile vedere il blocco di testo criptato subito dopo).

hacker-risultati-google

Per criptare il testo viene usato un base64 usato anche normalmente dai CMS. In questo caso il sito attaccato è un CMS Joomla ma la maggior parte dei siti afflitti da questo problema sono su Wordpress.

Come ripulire le directory dai file coinvolti?

Come accennato sopra, per risolvere il problema dei caratteri giapponesi e cinesi nella ricerca Google la prima cosa è stata individuare i file che avevano la stringa base64_decode e un malloppo di testo criptato, verificare che non fossero file originali ed eliminarli. Successivamente o scoperto che in ogni folder ( e sono tante…centinaia) era stato creato un file htaccess con delle istruzioni. In Joomla e Wordpress c’è di norma un solo file htaccess e si trova nella root. Grazie ad una funzione di ricerca avanzata di Filezilla ho potuto cercare tutti i file htacces con una precisa dimensione ed eliminarli in blocco…erano centinaia.

Infine ho cercato dentro cartelle sensibili come administrator e includes se erano stati creati altri file strani. Intanto procedevo con dei backup incrementali per tenere la situazione sotto controllo.

Una volta fatto questo si è però reso necessario andare a “dire” a Google che ora il sito andava re-indicizzato con i testi corretti. Ho quindi richiesto la scansione delle pagine e in breve facendo le ricerche le stringhe non c’erano più. Infine ho cambiato le password di accesso al backoffice, Ftp e Mysql. A questo punto al primo passaggio dello spider non c’erano più i caratteri cinesi e giapponesi nei risultati di ricerca.

Se ritieni di avere un problema simile sul tuo sito e ti serve aiuto contattami.


Graziano De Maio - Web Developer e SEO Specialist

Autore: Graziano De Maio

Web developer e SEO specilalist. Sono un consulente Seo – Web designer – Creo e fornisco assistenza su siti con Joomla e WordPress, sviluppo ecommerce con Woocommerce. Svolgo corsi Seo, Web Marketing, Joomla e WordPress di gruppo e one-to-one in azienda.