Analizor de interogări Yandex. Colectare automată Yandex Wordstat

27.07.2023 Panoul Straturi

Primul lucru pe care trebuie să-l aflați este: ce este analizarea. S-ar putea să cunoașteți această definiție și, chiar dacă nu o cunoașteți, va fi ușor de înțeles. Analizând– înseamnă colectarea de informații din orice sursă cu prelucrarea ulterioară a datelor. Daca vorbim de cazuri speciale, parsing in SEO (cu alte cuvinte, parsing results search) este colectarea si analiza statisticilor cererilor utilizatorilor.

Motoarele de căutare folosesc, de asemenea, analiza. Deci, roboții de căutare analizează analizând paginile web și introducând informații despre ele în baza de date a motorului de căutare.

Yandex.Wordstat este un serviciu foarte util pentru SEO. Dar puteți lucra cu el numai dacă aveți un cont Yandex. Vă permite să selectați cuvinte cheie pe baza solicitărilor utilizatorilor pentru a compune în continuare un nucleu semantic din ele.

În primul rând, trebuie să stabiliți subiectul. Ce vinzi? Ce servicii oferiți? După ce ați stabilit subiectul și ce veți solicita, puteți începe să utilizați Wordstat.

Introduceți interogarea dvs. în bara de căutare. Și extindeți-l folosind rezultatele returnate.

Rezultatele sunt formate pe două coloane. Numărul de lângă interogare este numărul estimat de afișări pe lună care pot fi primite selectând interogarea care vă place cu o expresie cheie. Prognoza este pentru ultimele 30 de zile înainte de data actualizării statisticilor.

Puteți configura rezultatele să fie afișate în funcție de regiune. Dacă furnizați servicii numai în Moscova, selectați fila „Toate regiunile” (se află chiar sub bara de căutare) și personalizați-o pentru dvs.

În coloana din stânga sunt toate expresiile cu cuvintele solicitării dvs., iar cuvintele din ea sunt sortate în ordinea descrescătoare a frecvenței afișărilor. Este important pentru dvs. să evidențiați imediat acele opțiuni cheie extinse care vor fi vizate pentru proiectul dvs. Interogările direcționate sunt acelea pentru care un utilizator care introduce o interogare într-un motor de căutare poate găsi ceea ce are nevoie pe site-ul dvs. Expresiile țintă vor avea o frecvență mai mică, iar utilizatorii care provin de la ele din rezultatele căutării vor putea găsi ceea ce și-au dorit, ceea ce înseamnă că nu vor părăsi site-ul dvs. imediat. Acești vizitatori sunt importanți pentru dvs., deoarece ei sunt cei care pot întreprinde acțiunea țintă - cumpărați un produs sau comandați un serviciu.

Verificați frazele selectate - excludeți-le pe cele cu o frecvență apropiată de zero. Pentru a face acest lucru, utilizați operatorul „ ” (ghilimele).

Apoi mergeți la coloana din dreapta.

Coloana din dreapta afișează interogări similare cu ale dvs. După ce ați adunat ceea ce aveți nevoie, nu uitați să verificați expresiile cu operatorul „ „ (ghilimele).

După ce ați tastat un număr suficient de fraze cheie, treceți la următoarea etapă: împărțiți frazele după frecvență. Acest lucru vă completează munca cu Wordstat.

Pentru unele cuvinte cheie, Wordstat oferă informații incorecte. Cum pot să-l verific? Accesați fila „Istoricul interogărilor” și acordați atenție statisticilor.

Statisticile sunt prezentate în 2 grafice: absolute și relative.

Indicator absolut– aceasta este valoarea reală a afișărilor pe diferite perioade de timp. Un indicator relativ este raportul dintre afișările pentru interogarea de interes și numărul total de afișări din rețea. Demonstrează popularitatea interogării printre toate celelalte.

Dacă graficul valorii relative este mai mare decât valoarea absolută, atunci poate că cererea este amplificată automat sau interesul pentru cerere este mai mare decât în ​​mod normal. Poate că acest lucru se datorează sezonului. Deci cererea de schiuri este mai mare iarna.

Procesul de analizare poate fi automatizat. În acest caz, este posibil să utilizați nu numai programe plătite și gratuite, ci și extensii de browser.

1. Extensia de browser Yandex Wordstat Assistant. Instalați-l în browser și, atunci când lucrați cu Yandex.Wordstat, în stânga va apărea un panou în care puteți colecta cuvintele cheie preferate.

2. Colector de chei– programul este plătit, dar foarte funcțional.

  • În setări există o filă „Yandex.Wordstat”. Mergând la el, puteți seta adâncimea de analiză. În acest fel, puteți colecta mai multe chei. Dar este recomandat să-l setați la 0 pentru a nu mări timpul. Și cheile pot fi extinse într-un alt mod, iar colectarea lor va dura mai puțin timp. Numărul maxim de pagini pentru analizare în Yandex.Wordstat este de 40. Fiecare pagină conține până la 50 de fraze. Astfel, numărul maxim de rezultate pentru o frază în Wordstat este 2000. Și dacă doriți să colectați mai multe date, trebuie să extindeți lista de cuvinte introduse adăugând cuvinte de calificare. De exemplu, nu doar „varză”, ci „conopidă”, „producție de varză”, etc.;

Dacă aveți un proiect mare cu un nucleu semantic pentru câteva sute sau mii de interogări, trebuie să recunoașteți că a sta în Wordstat și a le selecta manual va părea o tortură sofisticată. Este bine că există programe de asistență care pot prelua cea mai mare parte a muncii de rutină. Unul dintre aceste programe se numește Slovoeb.

Ce este Wordfucker

Slovoeb– o versiune gratuită (și semnificativ redusă în funcționalitate) a programului, iubită de optimizatorii profesioniști. Cele mai multe dintre funcțiile KeyColletor este puțin probabil să fie necesare de către utilizatorul obișnuit, așa că vă puteți descurca cu Sloboeb pentru a rezolva sarcina principală - selectarea cuvintelor cheie.

Apropo, KeyCollector-ul plătit vă permite să analizați cuvinte din Google AdWords - acest lucru este util mai ales dacă site-ul dvs. este axat în primul rând pe țările în care Google generează traficul principal. Slovoeb gratuit este limitat doar la Yandex.

Mai întâi trebuie să descărcați programul Slovoeb. Puteți face acest lucru folosind linkul de pe blogul SEOM.info.

Programul nu necesită instalare. Doar despachetați arhiva în orice locație convenabilă de pe computer și rulați Slovoeb.exe. În viitor, toate setările dvs. vor fi stocate în folderul selectat. Înainte de a începe lucrul, nu uitați să citiți materialul despre - informațiile din articol sunt, de asemenea, relevante pentru acest program.

Configurarea Slovoeb

Iată ce vom vedea după lansare:

Înainte de a începe, există o serie de setări pe care trebuie să le faceți. Primul este de a specifica conturile Yandex pentru analizarea cuvintelor cheie. Vă reamintesc că puteți lucra în Wordstat doar după autorizare. Prin urmare, vă sfătuiesc să aveți aproximativ cinci conturi special concepute pentru Slovoeb. Nu utilizați caractere speciale înparole pentru aceste conturi!

Nu recomand să folosiți contul dvs. real, deoarece programul face o mulțime de solicitări către Yandex pe unitatea de timp, pentru care puteți obține sancțiuni.

Faceți clic pe pictograma roată din partea stângă sus a ferestrei programului și accesați setări.

Selectați fila Yandex.Direct și introduceți datele contului în format autentificare:parolă. Dacă doriți, puteți specifica și un proxy. Asigurați-vă că citiți nota în fereastra de setări!


Vă sfătuiesc să studiați și să modificați alte setări software.

Recunoaștere automată a captcha

Următorul pas este automatizarea recunoașterii captcha. De acord, ce rost are programul dacă de fiecare dată vă cere să introduceți manual captcha emis de Yandex. Deoarece Slovoeb va trimite cereri către Yandex de multe ori într-o perioadă scurtă de timp, captchas-urile sunt inevitabile.

Folosesc serviciul Antigate. Dacă doriți, puteți utiliza alte programe. Slovoeb acceptă următoarele:

  • Antigate
  • CaptchaBot
  • RIPCaptcha
  • ruCaptcha
  • SocialLink

Mulți dintre ei de care nu auzisem până acum.

În cazul Antigate, există o nuanță: s-au mutat pe un site nou (deși cel vechi este încă disponibil). Ei folosesc o bază de date comună, astfel încât ambele site-uri au un singur cont. Cu care să te înregistrezi depinde de tine. Primul este mai clasic, spartan, mai familiar pentru webmasterii experimentați. Al doilea este mai modern.

Vă rugăm să rețineți că Antigate este plătit. Dar ieftin. 1 dolar îmi este suficient pentru 2 luni de muncă (sau chiar mai mult).

Accesați pagina de setări anti-captcha făcând clic pe fila din partea stângă a ferestrei de setări.

În câmp Cheie Antigate introduceți cheia anti-captcha. Îl puteți obține în setările profilului dvs. Antigate.


Aceasta completează configurarea de bază a Sloboeb.

Selectarea cuvintelor cheie folosind Slovoeb

Este timpul să începeți să selectați direct interogările. Pentru a face acest lucru, trebuie să creați un nou proiect. Toate datele sale vor fi salvate într-un fișier. Poate exista un număr nelimitat de astfel de fișiere, astfel încât să puteți comuta cu ușurință între proiecte.

Faceți clic pe butonul „Creați proiect”:

În fereastra care se deschide, selectează unde să salvezi fișierul și cum să-i denumești. De obicei numesc fișierele după numele site-ului și le salvez în folderul proiectului (unde se află toate celelalte date de pe el). Cineva păstrează toate fișierele lui Slovoeb într-un singur folder. Oricare este mai convenabil pentru tine.

Următorul pas după crearea proiectului este configurarea regiunii. Dacă site-ul dvs. se concentrează numai pe o anumită regiune (sau regiuni), aveți nevoie de statistici privind interogările de căutare pentru acea regiune, și nu pentru întreaga lume. Faceți clic pe butonul de selecție a regiunii și bifați casetele de care aveți nevoie.

Totul aici este la fel ca în interfața Wordstat:


Este timpul să selectați cuvinte cheie!

Pentru a începe să selectați interogări, faceți clic pe „ Colectare lot de solicitări din coloana din stânga a Yandex.Wordstat„ așa cum se arată în captura de ecran.

În fereastra care se deschide, introduceți cuvintele cheie pe baza cărora doriți să selectați interogările. Totul este exact la fel ca în interfața Wordstat. Principala diferență este că în program puteți introduce mai multe cuvinte deodată, iar programul va funcționa cu ele pe rând, dar în Wordstat trebuie să lucrați cu fiecare cuvânt pe rând, manual, ceea ce crește semnificativ timpul de lucru.

Faceți clic pe „ Începeți să colectați„. Ura, acum poți să faci cafea sau să treci la alte sarcini. Cuvântul nenorocit va avea nevoie de timp pentru a colecta cereri.

Cuvinte sigure

După ce programul a analizat cuvintele cheie, este necesar să le filtreze, eliminând combinațiile și formulările care nu ne interesează. Acest lucru se poate face folosind cuvinte oprite. Faceți clic pe butonul mare „ Cuvinte sigure” cu imaginea unui scut. În fereastra care se deschide, faceți clic pe „ Adăugați după listă„. Într-o altă fereastră care se deschide, enumerați cuvintele oprite (fiecare pe o linie nouă) care nu ar trebui să fie în interogarea dvs. de căutare. De exemplu, nu ne interesează solicitările cu cuvintele „descărcare”, „torrent”, „versiune nouă”, „ultima versiune”, etc., deoarece nu distribuim programul în sine, ci doar descrierea acestuia.

După ce ați introdus cuvintele stop, faceți clic pe „ Marcați frazele în tabel” în colțul din stânga jos al ferestrei de cuvinte oprite.

Lucrul cu frecvență în Slovoeb

A mai rămas o nuanță: frecvența interogărilor afișate în coloană este frecvența de bază, adică o frază cu toate formele de cuvinte. Pentru a determina frecvențele folosind operatori, faceți clic pe butonul cu lupa și selectați „ Colectați frecvențele formei ” ” “.

Un exemplu simplu și gratuit de parser PHP pentru statistici de cuvinte cheie cu wordstat Yandex.

Este clar că înainte de a promova un site, trebuie să te decizi asupra cuvintelor cheie. Aceasta nu este o muncă dificilă, dar minuțioasă. Pentru a găsi ceva util, trebuie să cercetați o grămadă de date. Prin urmare, este imposibil să faci fără instrumente de automatizare a proceselor. În această notă vreau să mă concentrez pe crearea unui parser de date PHP cu wordstat Yandex.

Aşa. Principala problemă la analizarea datelor din serviciul de statistică a cuvintelor cheie Yandex wordstat este prezența unui captcha. Nu este atât de greu să te deplasezi. Este suficient să transmiteți în cerere cookie-ul fuid01 generat în timpul procesării captcha. Cu alte cuvinte, va trebui să mergeți la serviciu, să faceți o cerere, specificând caracterele din imagine și să obțineți conținutul cookie-ului necesar.

Cum să obțineți conținut cookie fuid01 în browserul Firefox?

Deoarece Nu mă voi referi la epopee și alte opere grozave ale omenirii, voi descrie doar procesul de obținere a conținutului cookie-ului fuid01 în browserul Firefox (folosesc versiunea 8.0). În general, să lansăm Firefox. Presupunem că cererea către wordstat a fost deja făcută și cookie-ul a fost creat. Faceți clic pe butonul „Firefox” din colțul din stânga sus al ferestrei browserului. Selectați din meniu: Setări > Setări(nu confund nimic).

În fereastra „Setări” care se deschide, accesați fila „Confidențialitate”. Aici ne interesează blocul „Istorie”. Selectați „Voi folosi setările de stocare a istoricului” din lista Firefox și faceți clic pe butonul „Afișați cookie-urile...” care apare.

În fereastra „Cookie-uri”, în câmpul „Căutare”, introduceți numele cookie-ului care ne interesează, adică. „fuid01”. Lista ar trebui să afișeze ceea ce a fost găsit. Selectați unul dintre cookie-urile propuse și în câmpul de informații, selectați și copiați „Conținutul” acestuia.

Cum să lucrați cu parserul PHP wordstat Yandex

Puteți descărca gratuit paratorul de cuvinte PHP Yandex Aici. Voi spune imediat că acesta este doar un exemplu, al cărui lucru este de a analiza cuvintele cheie și de a le afișa pe ecran, dar totul este în ordine.

Primul lucru pe care trebuie să-l înțelegeți este că toate datele sunt prezentate în codificare UTF-8. Deci, dacă se întâmplă ceva, nu uitați să convertiți datele. Mai mult, pe unele servere aceasta poate fi o problemă, citiți mai multe. Următoarea nuanță este că pentru ca scriptul să funcționeze veți avea nevoie de sprijin. În rest, totul este destul de simplu.

Atribuim conținutul cookie-ului fuid01 variabilei $fuid01. În esență, această valoare este setată în curl_setopt() prin CURLOPT_COOKIE , dar pentru comoditate am scos-o separat. În continuare, suntem interesați de matricea $params - acestea sunt variabilele transmise în cerere către wordstat Yandex. De exemplu, m-am limitat la cea mai simplă variantă, deci nu a existat dinamică. În special, este analizată doar prima pagină a rezultatelor căutării: "page" => 1 , valoarea textului este obținută prin GET, dar regiunea este selectată Moscova: "geo" => 1 .

Este clar că identificatorul de regiune, dacă este nevoie de unul diferit, va trebui clarificat. Pentru a face acest lucru, accesați Yandex wordstat, faceți clic pe linkul „Specificați regiunea...” și selectați-l pe cel dorit.

După ce faceți o solicitare, trebuie să vă uitați la valoarea parametrului necesar din adresa URL. Trebuie remarcat faptul că, dacă sunt selectate mai multe regiuni, ID-urile acestora vor fi afișate separate prin virgule.

Urmează o solicitare către serviciul de statistică și analizarea datelor wordstat Yandex. Acesta din urmă are o mică nuanță. Faptul este că wordstat Yandex afișează statistici sub formă de două tabele: „ce căutau cu cuvântul...” și „ce mai căutau oamenii care căutau...” - l-am folosit doar pe primul unul. Totuși, acolo nu este nimic complicat. Expresiile regulate sunt destul de simple. Cred că o să-ți dai seama. Noroc!

Descărcați arhiva cu parser
Acest analizator colectează cuvintele cheie și frecvența într-un fișier Excel de la serviciul Yandex wordstat.
Dacă sarcinile dvs. frecvente includ colectarea de statistici privind cuvintele cheie de la serviciul Yandex Vodstat, atunci una dintre modalitățile de optimizare a fluxului de lucru este să delegați sarcina de a analiza cuvintele cheie analizorului.
Acest parser nu este original în funcționalitate, dar este original în ușurința setărilor și a regăsirii datelor prin cuvinte cheie.


Funcționalitatea acestui parser vă permite să colectați cuvinte cheie din serviciul wordstat.yandex.ru, statistici privind numărul de solicitări pentru cheile colectate, frecvența exactă a cheilor, precum și degruparea cheilor colectate în grupuri.

Setări parser:

1. Conectați-vă de la yandex.ru - în acest câmp trebuie să introduceți adresa căsuței dvs. poștale din Yandex mail

2. Parola de la yandex.ru - în acest câmp trebuie să introduceți parola din e-mailul Yandex

3. Fișier cu cuvinte cheie - acest câmp specifică un fișier cu o listă de cuvinte cheie (fișierul trebuie salvat în format utf-8, fiecare cheie pe o linie nouă Dacă intenționați să activați gruparea de interogări după colectare, atunci acest fișier ar trebui să fie salvat conțin doar 1 expresie cheie de bază (toate cuvintele numai cu litere mici (litere mici))

4. Fișier cu cuvinte negative - acest câmp conține un fișier cu o listă de cuvinte negative (fișierul trebuie salvat în format utf-8, fiecare cuvânt negativ pe o linie nouă)

5. Parse depth - până la ce adâncime să analizăm

6. Explore results - această opțiune activează etapa de grupare a interogărilor după ce sunt colectate cheile pentru fraza de bază (prin activarea acestei opțiuni, trebuie să specificați un fișier pentru a salva studiul)

7. Verificați frecvența exactă - această opțiune activează colectarea frecvenței exacte folosind cheile colectate

8. Scanare profundă - această opțiune activează scanarea profundă

9. Cheie pentru captchas - opțional

10. Fișier pentru salvarea cheilor - fișier Excel în care vor fi salvate cuvintele cheie din serviciul wordstat.yandex.ru

11. Fișierul pentru salvarea studiului este un fișier Excel în care clusterele grupate vor fi salvate după grupare

Dacă aveți întrebări sau sugestii, scrieți-ne pe e-mail [email protected]
skype - vipvodu
Descărcați arhiva cu parser

Un exemplu de fișier cu clustere după cheie - bază de date client.

Sfat:
1. Verificați cu atenție setările înainte de a începe.
2. Dacă programul, după ce faceți clic pe butonul „Rulare”, se oprește, atunci cel mai probabil este ceva în neregulă cu setările sau există procese blocate din analiza întreruptă anterioară, procesele blocate trebuie fie să fie oprite în sarcină. manager sau computerul trebuie repornit.
3. Nu întrerupeți analiza, așteptați mesajul - Toate datele au fost salvate

Unul dintre cele mai populare module din Rush Analytics este analizatorul Yandex Wordstat, iar acest lucru nu este o coincidență. La colectarea nucleului semantic, este necesar să se cunoască exact frecvența interogărilor colectate pentru a prioritiza corect promovarea și a scăpa de „gunoaie” și interogările nule. Adesea, sarcina este de a sparge câteva zeci de mii de solicitări de frecvență în Yandex, dar aceasta nu este o sarcină complet simplă pentru analizatorii Wordstat și programele desktop auto-scrise și iată de ce:

  1. Yandex Wordstat are o bună protecție împotriva parsării, de exemplu, interzicerea adreselor IP de la care se efectuează parsarea și aruncarea captcha ca răspuns la solicitările de la roboți. Pentru a colecta în mod eficient date de la Wordstat, aveți nevoie de un algoritm eficient pentru conectarea adreselor IP și alte trucuri
  2. Pentru a analiza o cantitate mare de date folosind programe desktop, veți avea nevoie de multe adrese IP (proxy-uri), pe care Yandex le poate interzice cu ușurință dacă algoritmul de conectare nu este optim, iar proxy-urile nu sunt o plăcere ieftină.
  3. De asemenea, pentru parsare va trebui să introduceți automat un număr mare de captch-uri (de exemplu, conectarea Antigate pentru această sarcină). Acest factor, dacă algoritmul de analizare nu este optim, poate face analiza în sine neprofitabilă, deoarece costul captcha va fi prohibitiv de mare
  4. Majoritatea programelor desktop nu au protecție împotriva pierderii datelor în timpul colectării. Deci, de exemplu, după ce ați colectat jumătate din date și am cheltuit bani pe ele, dacă analizatorul eșuează, riscați nu numai să nu primiți datele rămase, ci și să pierdeți datele deja colectate.

Analizarea Yandex Wordstat în Rush Analytics

Luând în considerare toate dificultățile care pot apărea la analizarea Wordstat, am făcut analizatorul nostru Wordstat la fel de rapid, convenabil și rezistent la numărul maxim de probleme asociate cu analizarea:

  • Fără proxy sau captcha! Nu mai trebuie să vă gândiți la interzicerea proxy-urilor sau a numărului mare de captch-uri pe care le emite Yandex. Doar creați un proiect, încărcați cuvinte cheie și așteptați fișierul rezultat final
  • Viteză mare de analizare. Algoritmii noștri folosesc schema optimă de conectare a adresei IP și alte trucuri pentru a face ca viteza de analiză să fie fenomenal de mare - nici măcar nu vei observa cum este finalizat proiectul tău!
  • Securitatea datelor. Prin crearea unui proiect în analizatorul nostru, puteți fi sigur că acesta va fi finalizat cu succes și disponibil pentru descărcare în orice moment și de oriunde în lume - toate datele sunt stocate în cloud!
  • Suport pentru toate regiunile Yandex. Mulți utilizatori trebuie să determine frecvența interogărilor în Yandex nu numai pentru regiunea Moscova sau Rusia, ci și pentru alții, inclusiv pentru Ucraina și Belarus. În Rush Analytics, puteți determina frecvența solicitărilor pentru orice regiune pe care Yandex o acceptă în prezent.
  • Colectarea tuturor frecvențelor. Folosind analizatorul nostru puteți colecta toate frecvențele: interogare de căutare, „interogare de căutare”, „!căutare!

  • Colectarea coloanei din stânga a Wordstat. Pe lângă verificarea frecvenței interogărilor, este posibil să colectați cuvinte cheie din coloana din stânga a Wordstat cu adâncime de analiză reglabilă de la o pagină pentru a colecta toate paginile din coloana din stânga.
  • Colectarea coloanei din dreapta a Wordstat. Este disponibilă o colecție de cuvinte cheie din coloana din dreapta a Wordstat.

Dacă aveți nevoie de o colectare de mare viteză a frecvențelor Yandex Wordstat, Rush Analytics este cea mai bună soluție, mai ales dacă aveți nevoie să colectați cantități mari de date. Pentru utilizatorii care trebuie să colecteze mai mult de 100.000 de solicitări pe lună, sunt furnizate condiții individuale, trebuie doar să scrieți la asistența noastră la