Cum se scrie un program pentru recunoașterea capului. Servicii de recunoaștere automată a caputerului. Obținerea numelui câmpului

Dacă lucrați adesea cu serviciile care necesită recunoașterea capului, atunci mai devreme sau mai târziu începe să vă gândiți la modul în care acest proces este automatizat. Mai ales, acest lucru se aplică acelor utilizatori care lucrează cu scripturi imacros.

De exemplu, utilizați script imacros. Pentru a alimenta automat anunțurile pentru buletinul de buletine gratuite (sau puneți anunțurile manual) și pe fiecare placă trebuie să introduceți un cod PIN.

De fapt, această sarcină este de a fi foarte ușor de rezolvat cu ajutorul recunoașterii automate a capului anti-CAPTCHA.

Serviciul vă permite să rezolvați automat captarea direct în browser. Pentru a face acest lucru, trebuie să instalați un plugin browser și, dacă este necesar, configurați nevoile dvs.

Când introduceți pagina care conține un cod PIN, pluginul va detecta automat și îl va trimite să recunoască (puteți anula această opțiune în setările pluginului).

Un avantaj imens este abilitatea de a rezolva Bore ReCAPTCHA. A instalat pluginul și a uitat cum să alegeți imagini cu semne rutiere, case etc.

Un exemplu de recunoaștere automată recaptcha cu un plug-in.

Trimiterea captcha la recunoaștere.

După câteva secunde, CAPTCHA a fost rezolvată.

Câteva exemple mai multe.

Soluție capace de yandex.

Decizie CAPTCHA privind buletinul de bord.

În același mod, puteți rezolva alte cappi, cum ar fi captcha vkontakte sau capp plat pe macarale bitcoin etc.

Dacă, plug-in-ul nu vede captcha, puteți utiliza meniul pentru a apăsa pe acesta și câmpul de introducere pentru CAPP.

Prețurile în serviciu sunt aceleași ca în toate aceste servicii. Prețul minim pentru 1000 de capace zdrențuite este de 0,7 USD. Timpul mediu de defalcare al unui CAPP este de 8 secunde.
Puteți completa contul în sistem într-un mod convenabil din valute terminale și electronice înainte de plata bancară.

Actualizarea cea mai anticipată și la scară largă a acestui an: mecanismele de prelucrare a noilor versiuni ale forumului și a platformelor de blog sunt actualizate, baza de date a răspunsurilor la aspectele antibot (TextKapchy) este mărită cu 60.000 de noi text, datorită faptului că eficacitatea Xrumerul a crescut la zeci de ori, ceea ce a arătat în mod clar teste comparative. Actualizarea include peste 100 de îmbunătățiri și corecții.

20 august 2019.

Xrumer 18.0 - 18.0.1

Actualizarea xrumer la scară largă, care a evoluat în mod semnificativ logica înregistrării profilurilor pe o varietate de platforme, o funcționare îmbunătățită cu Bitrix, platformele Joomla, forumul WordPress, MybB, Vbulletin, XenForo, a adăugat un mecanism de modificare a textului trimis în funcție de Subiectul site-ului Beneficiar (New Macro # Tema), actualizat și extins Bazele însoțitoare - volumul total a depășit 8 milioane de site-uri, lucrări îmbunătățite cu HTTPS și Google ReCAPTCHA-2 și mult mai mult ...

26 ianuarie 2019.

XRUMMER 16.0.18 + SOCPlugin 4.0.63

Bazele însoțitoare sunt verificate și actualizate, volumul total este crescut la 8 (!) Milioane de resurse acceptate - bloguri, forumuri, cărți de oaspeți, panouri, BBS, CMS și alte platforme. Baza celebre de textcaps este mărită cu mai mult de 2.000 de răspunsuri noi la întrebările anticot și acum se ridică la 324.000 de text. Stabilitatea și viteza de muncă sunt îmbunătățite semnificativ, consumul de cost este optimizat: plafonul ajunge până la 500 sau mai multe fluxuri (în funcție de modul de operare). Lucrări îmbunătățite cu HTTPS. Și principala îmbunătățire cheie: eficiența mesajelor personale este în mod repetat ridicată - Modul MassPM. Plus, multe alte îmbunătățiri și corecții :)

14 septembrie 2018.

Trebuie să activați JavaScript să lucreze corect

Recunoașterea capotei / suport automatic Capp

Cu siguranță, aproape toată lumea a intrat în inscripție atunci când se înregistrează pe orice site: "Introduceți numărul pe care îl vedeți" și imaginea distorsionată. Acesta este un stilou (captcha, pictocode, bilet) - protecție grafică concepută pentru a distinge oamenii și programele.

În procesul de lucru, programul XRUMMER este capabil să recunoască amprentele, descărcând automat imaginea și decriptarea acestuia. După cum a arătat practica, nu necesită mai mult de 1-1,5 secunde pentru a descifra de acest tip și, de obicei, mai puțin pe un computer cu un procesor cu o frecvență de lucru de 1 GHz. Traficul pe ea lasă foarte puțin, pentru că Asemenea imagini sunt "cântărind" nu mai mult de 3-5 kb.

Dar asta nu este tot! Nou Xrumer 19.0.3 Elite Acum este capabil să recunoască și să ocolească chiar și astfel de tipuri de capace ca ReCAPTCHA și DLE! DAR lista generală a tipurilor recunoscute a crescut mai mult de două ori mai mare decât în \u200b\u200bcomparație cu XRUMMER 5.0:

Și acest lucru nu este tot felul, nu există capace foarte triviale, care au fost folosite la versiunile timpurii ale forumurilor și au rămas încă pe mulți dintre ei. Xruerul recunoaște automat tipul de acoperire și utilizează algoritmul corespunzător acestui tip.

Bună ziua, Stimate site-ul de cititoare blog. Antikapcha. (Temporar a fost antgate) - aceasta este o platformă multifuncțională pentru recunoașterea automată a așa-numitului capphitch (protecția împotriva roboților de postare automată, precum și protejarea motoarelor de căutare de la parsarea emisiunii acestora).

Aproximativ fiecare al doilea site din lume este forțat să recurgă la astfel de măsuri de protecție atunci când este detectată activitatea suspectă a roboților. Cultură pentru blog, de exemplu, evită apariția masei aceluiași tip de mesaje, postarea frecventă și publicitatea în comentarii.

Toate aceste motive creează o povară considerabilă pe site-uri, iar CAPTCHA este mare pentru rolul detectării umane în rândul armatei sticlei. Cu toate acestea, fiecare acțiune se opune. Există oameni care au nevoie să rezolve în mod constant CAPTCHA (cei care utilizează software special pentru înregistrările de masă, analizând rezultatele căutării etc.).

Acesta este doar astfel de oameni, iar sistemul de soluționare automată a acestor reini este propus - Anticaptcha.. Ei au o întreagă armată de muncitori (sunt stabiliți - aceasta este partea inversă a Antikapchi). Să ne ocupăm de modul de utilizare a resurselor anti-CAPCHA și că va fi necesară pentru aceasta.

Ce este captcha și de ce apare?

De asemenea, Antigate poate fi util la promovarea unui serviciu sau a unor pagini în rețeaua socială folosind propriul script. Într-un cuvânt, domeniile de aplicare sunt foarte multe care distinge această resursă de la analogi, accentuată sub 2-3 funcții și cu prețuri ridicate.

Cum să lucrați cu serviciul antikapcha

Înainte de a crea prima comandă, treceți printr-o mică înregistrare.

Numai e-mailurile vor fi necesare. Parola va veni la ea.

Apoi, nevoie completați echilibrul pe serviciu. Limita minimă este de la un cent, care este suficient de mare pentru testul funcțiilor anti-kapchi. În plus, puteți profita de o ofertă specială: Prima CAPTCHA va fi rezolvată gratuit.

Alte capace vor costa de la 0.001 dolari (de obicei) la 0,002 dolari (Google ReCAPTCHA). Nu uita copiați cheia APIcare este generată în mod automat. Veți găsi pe pagina principală de resurse.

Descărcați aplicația ANTGEDION pe PC (puteți face acest lucru pe site-ul oficial) și activați calea automată de declanșare a CAPP. Pentru a clarifica datele statistice, acordați atenție meniului. Acesta este situat în colțul din dreapta al paginii.

Puteți completa echilibrul pe principal, făcând clic pe butonul "Completați un cont". Soluție alternativă - Deschideți elementul "Finanțe" din meniu și faceți clic pe "Completați contul" acolo. Puteți gestiona procesul direct din meniul Setări. De exemplu, pentru a modifica informațiile din contul dvs.

Pentru a lucra a fost mai confortabil, utilizați instrumente suplimentare care pot fi găsite și în meniu. Cu ajutorul ferestrei "Help", puteți vizualiza documentația de serviciu, precum și citiți știrile proiectului, găsiți răspunsuri la orice întrebări despre Antikapchi.

Contactați dezvoltatorii

Dacă aveți întrebări legate de activitatea site-ului sau aplicației, puteți scrie întotdeauna dezvoltatorilor. Adresa oficială a Antikapchi - [E-mail protejat]

Există, de asemenea, mai multe forumuri specializate pe care vă puteți consulta cu utilizatorii site-ului. Le puteți găsi folosind orice motor de căutare.

Sistem de recomandare

În condițiile sistemului de trimitere, creatorii serviciului au reacționat cu o atenție deosebită. De aceea, dacă intenționați să câștigați propriile dvs. trimiteri, asigurați-vă că ați citit regulile. Există puține dintre ele și sunt simple în performanță, dar în caz de nerespectare a obligațiilor, nu veți putea să vă măriți venitul.

Subcounturile pot fi după cum urmează:

  1. Subcounturile inactive - înregistrate în sistem, dar nu fonduri plăcute de utilizator.
  2. Active - utilizatorii care au trecut în registru, dar cu un număr mic de comenzi - nu mai mult de cincizeci de kip pe săptămână.
  3. Efectuarea de cheltuieli - conturi care ordonă o defalcare de la cincizeci KIP și mai mult săptămânal.
  4. Efectuarea cheltuielilor prin aplicație - utilizatorii care au comandat, de asemenea, defalcarea picăturilor (mai mult de 50 de piese), dar prin utilitatea specială "AppCenter".

Invitarea clienților noi, puteți câștiga 10% dintre recomandări, "efectuarea cheltuielilor" și 5% din cheltuielile prin intermediul cererii. " Pentru fonduri, trebuie să aveți cel puțin cinci subconecții cu stare sporită (utilizatorii activi pe care l-ați atras de site). Imediat după încărcarea capppitch, veți fi listat în suma specificată.

Numărul de recomandări invitate nu se limitează la regulile, dar referințele de la un utilizator nu pot fi mai mult de zece bucăți.

rezumat

Resursa "Antikapcha" este ideală pentru corespondența în masă și promovarea pe diverse site-uri. Costul scăzut al serviciilor și posibilitatea de a câștiga recomandările trebuie să le utilizeze. Rularea de noi utilizatori, puteți salva pe placa de decodare a capacului.

Rezultatul este destul de accesibil și chiar ieftin pentru SEO Masters și SMM. Ce altceva? Dacă nu puteți vedea (în esență, acesta este concurentul lor principal).

Multă baftă! La întâlnirile ambigue pe site-ul web al blogului

S-ar putea să fiți interesat

Captcha (captcha) - ceea ce este și pentru ceea ce este folosit
Întrebări frecvente și întrebări frecvente - Ce este?
Feedback pentru site-ul utilizând scripturile formularelor pe HTML și PHP, precum și designeri online și generatoare
Radical - Fotografie gratuită de găzduire cu o fotografie rapidă și ușoară de descărcare prin Radikal.ru Ce este un bot - scopul de a crea, soiuri de programe și exemple de utilizare Cum să eliminați poșta și cutie poștală pe mail.ru, Yandex și Gmail Bitfun - Cum să câștigi Satoshi pe macara populară Bitcoin Sondajul de Internet - decât InternetulOpros este alocat printre altele chestionare plătite + 10 secrete Creșteți câștigurile pe el Bonusbitcoin - Macara Bitcoin cu recenzii excelente Google TRANSLETE - traducere din fotografie, introducerea vocii, frazebook, modul offline și multe altele

Aceste tehnici voi demonstra pe Kap experimental. Ca Guinee, am ales o limpădă a unor rafonte la care am întâlnit când căutam materiale pentru articolul precedent.

Exemplu de limitare generată:

Contextul pe care trebuia să-l folosesc celălalt, deoarece autorul nu a postat originalul (sau nu am găsit-o), dar nu va afecta rezultatul.

Preprocess

Ca rezultat al acestei acțiuni, vom obține o secțiune masimică a unei imagini monocrome cu text.

În primul rând avem nevoie fundal separat din text. Analizăm codul de generare a imaginii și codului. Există mai multe greșeli:

  • A folosit o singură culoare pentru întregul test de cod
  • Culoarea pentru text este generată în intervalul de rand (0, 200), 0, Rand (0, 200), pentru RG B, respectiv (este suficient pentru a evidenția culorile numai în această gamă)
  • Context cu o mulțime de culori diferite (nu va putea influența statisticile celei mai frecvent utilizate culori)

Acum, pe baza acestor fapte, analizați culoarea fiecărui pixel în întreaga imagine și alocați cele mai frecvente utilizate. Deschis 8C0074. (în formă hexagonală). Îi întrebăm o mică eroare și alocă această culoare și puțin similară cu ea, luând în considerare eroarea. Toate vopselele selectate negru, restul sunt albe. Se pare că o astfel de imagine:

După cum puteți vedea, am primit textul, practic fără distorsiuni. Adevărat, o linie a rămas, dar avem un algoritm de tăiat complicat (despre el mai jos), la care această linie nu va putea influența.

Acum subliniem un complot cu codul.
Deoarece textul nostru este locul cel mai întunecat, atunci încercăm să găsim algoritmic pete. În primul rând, determinăm limitele orizontale:

Acum definim limitele verticale:

Linia a rămas aici pentru că este încă percepută de funcția ca zonă foarte întunecată. Dar acum, pe baza acestor limite, le specificăm în conformitate cu a doua rundă, orizontală:

Și de ce acum această linie a fost eliminată? Deoarece a fost acum analizată de "coloane de pixeli" și atunci când analiză algoritmul a arătat că în această secțiune există prea multe coloane cu un pixel negru și, prin urmare, acest zgomot este un zgomot. Acum specificăm granița verticală:

Deoarece zona de definiție a devenit mai mică, acum acea linie a fost zgomotul punctului întunecat și a fost îndepărtat deloc. Așa că avem un complot cu text. Desigur, acest algoritm uneori nu alocă pe bună dreptate zona dorită. Dar, conform testelor mele, numărul de definiții incorecte nu depășește 5% decât poate fi neglijat.

Segmentare

Acum, sarcina noastră este să împărțiți imaginea rezultată zone separate cu simboluri.

Bineînțeles că puteți conta, căutați limitele personajelor și așa mai departe. Dar dacă analizați din nou codul de generare, puteți găsi o altă eroare.

  • O indentare între fiecare simbol este întotdeauna egală cu 15 pixeli

Desigur, uneori din cauza dimensiunii personajelor, ei merg dincolo de cincisprezece pixeli, atunci trebuie să mutați de la un simbol vecin altul sau doi pixeli. Dar acest lucru nu este critic. În general, împărțim imaginea:

Acum, după cum vedem în jurul unor personaje, există o zonă goală. Și mai avem nevoie de simbolul însuși. Aplicați funcția Trim pentru fiecare caracter, iar imaginile rezultate se potrivesc în dreptunghiuri de 17 × 27:

Acestea sunt astfel de imagini separat vor fi aplicate la recunoaștere.

Recunoaştere

Recunoaștere Vom produce fără rețele neuronale noi. De ce? Rolul decisiv a fost jucat de ceea ce, nu există o singură bibliotecă demnă sub Windows. Vom folosi recunoașterea obișnuită asupra măștilor de caractere.

Pentru asta, avem acces la codurile sursă, Fac o grămadă de imagini alb-negru pentru fiecare simbol cu \u200b\u200bunghiuri diferite de rotiri (de la două la patru grade) și diferite dimensiuni ale fonturilor (de la 20pt la 30pt). Fiecare imagine rezultată, așa cum ați ghicit, se potrivesc într-un dreptunghi de 17 × 27. Fiecare imagine primită este numită o mască.

Pentru fiecare scrisoare am păstrat 10-15 măști. Principiul acestui lucru este suficient, dar dacă creșteți numărul de măști, puteți crește procentul de recunoaștere.

În general, toate imaginile sunt comparate cu intrarea, în comparație cu măștile, iar algoritmul determină ce masca se potrivește cel mai mult de imaginea noastră, bazată pe aceasta, făcând concluzia despre care simbolul este scris în imagine.

Rezultate

Pentru testare, am primit folosind generarea imaginii și împărțirea pe simbolurile a 200 de caractere rătăcitoare. Și programbilly a lansat testul. Și atenție!
Rezultat: Succes: 172 Erori: 28%: 86%
Adică fiecare simbol pe capace va fi recunoscut cu succes cu o probabilitate de 86% !

O mică matematică. Calculați procentajul probabilității de recunoaștere a capului de succes:
Pentru capacele de 4 simboluri: 0.86 ^ 4 \u003d 54%
Pentru capacele de 5 simboluri: 0.86 ^ 5 \u003d 47%

In medie Fiecare secundă Capca va fi recunoscută cu succes.

Dacă considerați că fiecare captcha are aproximativ 1 secundă, iar 2 secunde va fi în medie pentru recunoașterea reușită. Acesta este un rezultat foarte excelent.

Surse

Scenariul în sine generează și același lucru recunoaște capacul. Un exemplu de script asupra imaginii de mai jos de către Autorul Cappic:

(Picture Clickable)

Există modalități diferite pentru captcha.care sunt situri protejate. În primul rând, există servicii speciale care utilizează o muncă manuală ieftină și literalmente pentru o ofertă de 1 USD pentru a rezolva 1000 pe capac. Alternativ, puteți încerca să scrieți un sistem inteligent care, conform anumitor algoritmi, va fi recunoscut. Acestea din urmă pot fi acum implementate utilizând o utilitate specială.

Rezolva captcha.

Recunoașterea CAPTCHA - sarcina este cel mai adesea nontrivială. Imaginea de care aveți nevoie pentru a aplica o mulțime de filtre diferite pentru a elimina distorsiunea și interferența, pe care dezvoltatorii doresc să consolideze rezistența la securitate. Adesea, este necesar să se implementeze sistemul studențesc bazat pe rețele neuronale (Aceasta, apropo, nu este atât de dificilă, așa cum pare) pentru a obține un rezultat acceptabil asupra soluției automatizate a CAPP. Pentru a înțelege despre ce vorbesc, este mai bine să ridicați arhiva și să citiți articolele minunate "Hacking CAPTCHA: Teoria și practica. Înțelegem cum se rupe capacele "și" vom vedea și recunoaștem. Hacking Filtrele CAPTCHA "de la # 135 și respectiv # 126 camere. Astăzi, vreau să vă spun despre dezvoltarea tessercap, pe care autorul îl numește CAPTCHA Felii Universal. Lucru curios, indiferent cât de cool.

Uită-te la Tessercap

Ce a făcut autorul programului? Se uită, de obicei, potrivit problemei soluției automate CAPTCHA și a încercat să rezume această experiență într-un singur instrument. Autorul a observat că pentru a elimina zgomotul din imagine, adică soluții la cele mai multe sarcină complexă La recunoașterea CAPP, aceleași filtre sunt cele mai des utilizate. Se pare că, dacă implementați un instrument convenabil care permite transformarea complexă matematică să aplice filtre pe imagini și să o combine cu un sistem OCR pentru a recunoaște textul, atunci puteți obține un program complet eficient. Aceasta, de fapt, a făcut-o pe Gurs'ev Singh Calra de la McAfee. De ce a avut nevoie de ea? Autorul utilității a decis să verifice cât de mult este capacele resurselor majore. Pentru testare, au fost alese aceste site-uri de Internet, care sunt cele mai vizitate în funcție de versiunea faimosului serviciu de statistici. Monsters, cum ar fi Wikipedia, Ebay, precum și furnizorul Recapptcha, au devenit candidați pentru participarea la teste.

Dacă luăm în considerare, în termeni generali principiul funcționării programului, atunci este destul de simplu. Captarea sursei intră în sistemul de pre-procesare a imaginilor care curăță calea de la orice zgomot și distorsiune și de transportorul imaginii transmise a sistemului OCR, care încearcă să recunoască textul pe acesta. TESSERCAP are o interfață grafică interactivă și are următoarele proprietăți:

  1. Are un sistem universal pentru preprocesarea imaginilor care pot fi configurate pentru fiecare CAPP individual.
  2. Include un sistem de recunoaștere Tesseract care preia textul din imaginea CAPTCHA analizată anterior și pregătită.
  3. Sprijină utilizarea diferitelor codificări în sistemul de recunoaștere.

Cred că sensul general este clar, așa că propun să văd cum arată. Universalitatea utilității nu a putut duce la complicarea interfeței sale, astfel încât fereastra programului să poată intra într-o mică stupoare. Deci, înainte de a continua recunoașterea crucii, propun să se ocupe de interfața și de funcționalitatea stabilită.


Prelucrarea și extragerea imaginii preliminare
textul Capp

Despre

Nu am putut spune cel puțin câteva cuvinte despre autorul utilității minunate de Tessercap. Numele lui este Gurs'ev Singh Calra. Funcționează ca consultant principal în Divizia Foundstone Professional Services, care este inclusă în McAfee. Gursyev a jucat la astfel de conferințe ca Torcon, Nullcon și Clubhack. El este autorul Tessercap și SSLSMART unelte. În plus, a dezvoltat mai multe instrumente pentru nevoile interne ale companiei. Limbi de programare preferate - Ruby, Ruby pe șine și C #. Divizia Foundstone® Professional Services în care funcționează, oferă servicii de experți și formare organizațiilor, asigură protecția permanentă și eficientă a activelor lor de la cele mai grave amenințări. Echipa diviziei de servicii profesionale constă în experți recunoscuți în domeniul securității și dezvoltatorilor care au o experiență bogată în cooperare cu corporațiile și statul internațional

Interfață. Fila principală

După pornirea programului, apare o fereastră cu trei file: principale, opțiuni, preprocesare imagine. Fila principală conține controale care sunt utilizate pentru a începe și a opri testul de imagine CAPTCHA, formarea statisticilor de testare (cât de mult este depusă și cât de multe), navigați și selectați imaginea pentru pre-procesare. În câmpul de introducere URL (numărul de control 1), adresa URL exactă trebuie specificată ca aplicația web utilizată să extragă CAPP. URL-ul poate fi obținut după cum urmează: Faceți clic pe partea dreaptă a imaginii CAPTCHA, copiați sau vizualizați codul paginii și extrageți adresa URL din atributul SRC al etichetei de imagine. Site / Common / Rateit / CAPTCHA.ASP? În apropierea șirului de adrese este un element care solicită descărcarea numărului de capace pentru a fi testate. Deoarece aplicația poate arăta simultan doar 12 imagini, furnizează elemente de controale pentru fraudă de pagină. Astfel, cu testarea la scară largă, vom putea să parcurgeți capacele încărcate și vom vedea rezultatele recunoașterii acestora. Butoanele încep și oprirea sunt porniți și opriți testarea, respectiv. După testare, trebuie să estimați rezultatele recunoașterii imaginii, notați fiecare dintre ele ca fiind corect sau incorect. Ei bine, acesta din urmă, cea mai semnificativă funcție este utilizată pentru a transmite orice imagine în sistemul de pre-procesare, în care este specificat filtrul care elimină zgomotul și distorsiunea imaginii. Pentru a transfera imaginea în sistemul de pre-procesare, trebuie să faceți clic pe imaginea dorită cu butonul din dreapta al mouse-ului și să selectați Trimiteți la imaginea Preprocessor în meniul contextual.

Interfață. Fila Opțiuni

Fila Opțiuni conține diferite controale pentru configurarea tessercap. Aici puteți selecta un sistem OCR, setați setările proxy Web, activați imaginile de redirecționare și pre-procesare, adăugați anteturi HTTP personalizate, precum și specificați gama de caractere pentru sistemul de recunoaștere: numere, litere în literele mici, literele din litere mici Cazul superior, caractere speciale.

Acum despre fiecare opțiune în detaliu. În primul rând, puteți alege sistemul OCR. În mod implicit, numai unul este disponibil - Tesseract-Orc, deci nu trebuie să vă deranjezi cu alegerea. Altul foarte mult o oportunitate interesantă Programe - Selectați intervalul de caractere. Luați, de exemplu, CAPTCHA de pe site - se poate observa că nu conține nicio literă, ci constă doar la numere. Deci, de ce avem nevoie de caractere suplimentare care vor crește doar probabilitatea recunoașterii incorecte?. Dar dacă alegeți partea superioară? Programul va recunoaște un cappă constând din litere mari orice limbă? Nu pot. Programul ia o listă de caractere utilizate pentru a recunoaște, de la fișiere de configurareSituat în \\ Program Files \\ Foundstone Tools Free \\ Tessercap 1.0 \\ Tessdata \\ Configs. Voi explica despre exemplul: Dacă am ales numeric și opțiunile cu litere mici, programul va contacta fișierul lateral pornind de la parametrul Tesdit char.whitelist. Rezultă o listă de caractere care vor fi folosite pentru a rezolva cappul. În mod implicit, fișierele conțin doar literele alfabetului latin, deci este necesar să înlocuiți sau să adăugați o listă de caractere pentru a recunoaște chirilicul.

Acum, puțin despre ceea ce aveți nevoie de câmpul de solicitare a cererilor HTTP. De exemplu, pe unele site-uri web trebuie să fie conectate, pentru a vedea captcha. Pentru a utiliza Tessercap pentru a avea acces la un KAP, programul trebuie trimis în cererile HTTP, astfel de titluri ca acceptarea, cookie-ul și referință etc. Utilizarea proxy-ului web (Fidedler, Burp, Charles, Webscarab, Paros, etc.), puteți Prindeți anteturile de interogare trimise și introduceți-le în câmpul de introducere a antetelor cererii HTTP. O altă opțiune care este probabil utilă este urmată de redirecționare. Faptul este că Tessercap implicit nu trebuie redirecționat. Dacă adresa URL de testare trebuie să urmeze imaginea pentru a obține o imagine, trebuie să selectați această opțiune.

Ei bine, ultima opțiune a rămas, care include / deconectează mecanismul de pre-procesare, pe care îl vom uita mai departe. Implicit, imaginile de pre-procesare sunt dezactivate. Utilizatorii personalizează mai întâi presetarea presetării imaginilor conform imaginilor CAPTCHA testate și apoi activați acest modul. Toate imaginile CAPTCHA au fost descărcate după pornirea opțiunii de pre-procesare a imaginii Activați, treceți pre-procesarea și sunt deja transmise sistemului TESSERACT OCR pentru a extrage textul.

Interfață. Fila de preprocesare a imaginilor

Ei bine, am ajuns la fila cea mai interesantă. Aici filtrele sunt configurate pentru a elimina diverse zgomote și blur, care încearcă să complice cât mai mult sarcina sistemului de recunoaștere. Procesul de înființare a unui filtru universal este extrem de simplu și constă din nouă etape. În fiecare etapă de pre-procesare, este afișată. În plus, pagina are o componentă a inspecției care vă permite să estimați corectitudinea capului cu un filtru de extensie. Luați în considerare în detaliu fiecare etapă.

Etapa 1. Inversiune de culoare

În acest stadiu, culorile pixelilor pentru imaginile CAPTCHA sunt inversate. Codul de mai jos demonstrează modul în care se întâmplă acest lucru:

Pentru (fiecare pixel în captcha) (dacă (inversat este adevărat) nou roșu \u003d 255 - roșu curent dacă (invertblue este adevărat) albastru nou \u003d 255 - albastru curent dacă (InverTgreen este adevărat) NEW GREEN \u003d 255 - verde curent)

Inversiunea uneia sau mai multor culori deschide adesea noi caracteristici pentru verificarea imaginii Chapcha de testare.

Etapa 2. Schimbarea culorii

În acest pas, puteți schimba componentele de culoare pentru toți pixelii imaginii. Fiecare câmp numeric poate conține 257 (de la 1 la 255) valori posibile. Pentru componentele RGB ale fiecărui pixel, în funcție de valoarea, se efectuează următorii pași în câmp:

  1. Dacă valoarea este -1, componenta de culoare corespunzătoare nu se schimbă.
  2. Dacă valoarea nu este egală cu -1, toate componentele au fost găsite culoare specificată (roșu, verde sau albastru) Schimbarea în funcție de valoarea introdusă în câmp. Valoarea 0 șterge componenta, valoarea 255 stabilește intensitatea maximă etc.

Etapa 3. Grada Gray (scala luminozității)

În cea de-a treia etapă, toate imaginile sunt convertite în imagini în grade în tonuri de gri. Acesta este singurul etapă obligatorie a transformării imaginilor care nu pot fi ratate. În funcție de butonul selectat, se efectuează una dintre următoarele acțiuni asociate componentei de culoare a fiecărui pixel:

  1. Media -\u003e (roșu + verde + albastru) / 3.
  2. Human -\u003e (0,21 * roșu + 0,71 * verde + 0,07 * albastru).
  3. Media componentelor minime și maxime ale culorilor -\u003e (minim (roșu + verde + albastru) + maxim (roșu + verde + albastru)) / 2.
  4. Minim -\u003e minim (roșu + verde + albastru).
  5. Maxim -\u003e Maxim (roșu + verde + albastru).

În funcție de intensitatea și distribuția componentei culorilor CAPTCHA, oricare dintre aceste filtre poate îmbunătăți imaginea extrasă pentru prelucrarea ulterioară.


Etapa 4. Smoothing și claritate

Pentru a complica extragerea textului de la captcha-imagini, acestea adaugă zgomot sub formă de puncte unic sau cu mai multe fețe, linii străine și distorsiuni spațiale. La netezirea imaginii, crește zgomotul aleator, pentru a elimina pe care se utilizează filtrele cu găleata sau cutoff. În câmpul numeric, trecerile trebuie specificate de câte ori trebuie să aplicați masca de imagine corespunzătoare înainte de a merge la pasul următor. Să ne uităm la componentele filtrului pentru netezire și creșterea clarității. Sunt disponibile două tipuri de măști de imagine:

  1. Măști fixe. În mod implicit, Tessercap are șase măști de imagine cele mai populare. Aceste măști pot netezi imaginea sau pot crește claritatea (transformarea Laplace). Modificările sunt afișate imediat după selectarea mascăi utilizând butoanele corespunzătoare.
  2. Masca de imagine personalizata. Utilizatorul poate configura, de asemenea, măști personalizate de procesare a imaginilor prin introducerea valorilor în câmpuri numerice și apăsând butonul Salvați Mask. Dacă suma coeficienților din aceste ferestre este mai mică de zero, se eliberează o eroare și masca nu se aplică. Atunci când alegeți o mască fixă, butonul de masaj de salvare nu este necesar.

Etapa 5. Introduceți nuanțe de gri

În această etapă a procesării imaginii, pixelii ei pot fi vopsite într-o gamă largă de nuanțe de gri. Acest filtru afișează distribuția gradațiilor gri în 20 de bakncakes (găleată) / intervale. Procentul de pixeli pictat în nuanțe de gri în intervalul de la 0 la 12 este listat în boabe (găleată) 0, procentul de pixeli vopsite în nuanțe de gri în intervalul de la 13 la 25 - în BAKKET (găleată) 1 , etc. Utilizatorul poate selecta unul dintre următorii pași pentru fiecare gamă de valori corespunzătoare nuanțelor de gri:

  1. Las-o asa.
  2. Înlocuiți albul alb (alb).
  3. Înlocuiți negrul negru.

Datorită acestor opțiuni, puteți controla diverse intervale de nuanțe de gri, precum și tăierea / îndepărtarea zgomotului prin schimbarea nuanțelor de gri spre alb sau negru.

Pasul 6. Setarea decuplă (cutoff)

Acest filtru construiește un grafic al valorii nivelului de gri de la frecvența apariției și ofertelor pentru a alege un clip. Principiul funcționării filtrului de tăiere este prezentat mai jos în pseudocod:

Dacă (valoarea de agitare a pixelilor<= Cutoff) pixel grayscale value = (0 OR 255) -> În funcție de opțiunea care este selectată (<= или => : Stabiliți pixelul cu valoare<=/=> Pragul la 0. Rămânând la 255)

Graficul prezintă o distribuție detaliată a Pixelilor CAPTCHA în culori și ajută la eliminarea interferențelor prin tăierea valorilor nivelului gri.

Etapa 7: declanșarea (tăierea)

După aplicarea stelui, cut-off, găleată și alte filtre de imagine CAPTCHA, pot fi încă slăbite prin puncte unice sau cu mai multe fețe, din afară și distorsiuni spațiale. Principiul funcționării filtrului de tăiere este după cum urmează: Dacă numărul de pixeli adiacenți vopsite în această nuanță de gri, mai puțin decât dimensiunea în câmpul numeric, filtrul conductei îi atribuie valoarea 0 (negru) sau 255 (alb) selectând un utilizator. În acest caz, CAPTCHA este analizată atât în \u200b\u200bdirecția orizontală, cât și în direcție verticală.

Etapa 8: Schimbarea lățimii marginii

Potrivit autorului utilității, în timpul cercetării inițiale și dezvoltării TESSSERCAP, a remarcat în mod repetat că atunci când imaginile CAPTCHA au o linie de frontieră groasă și culoarea sa diferă de fundalul principal al CAPTCHA, unele sisteme OCR nu pot recunoaște textul. Acest filtru este conceput pentru a procesa linii de frontieră și modificările lor. Liniile de frontieră cu o lățime care este listată în câmpul numeric sunt vopsite în negru sau alb prin selectarea utilizatorului.

Etapa 9: Inversiunea umbra gri

Acest filtru trece fiecare pixel și înlocuiește valoarea sa de nivelul de gri nou, după cum se arată mai jos în pseudocod. Inversarea griului este efectuată pentru a se potrivi imaginii sub setările de culoare ale sistemului OCR.

Pentru (fiecare pixel în CAPTCHA) Noua valoare de tonuri de gri \u003d 255 - Valoarea curentă agramescale

Pasul 10: Verificarea recunoașterii de captare

Scopul acestei etape este de a transfera imaginea CAPCHA procesată anterior a sistemului OCR pentru recunoaștere. Butonul de rezolvare ia imaginea după ce un filtru de inversiune gri trimite la sistemul OCR pentru a extrage textul și afișează textul returnat în interfață grafică. Dacă textul recunoscut coincide cu textul pe un cod PIN, setăm corect filtrul pentru pre-procesare. Acum puteți accesa fila Opțiuni și puteți activa opțiunea de preprocesare pentru procesarea tuturor capacelor încărcate ulterioare.

Recunoașteți cappii

Ei bine, poate că am analizat toate opțiunile pentru acest utilitar, iar acum ar fi frumos să testați orice limită pe putere ..


Rezultatul analizei site-ului Capper cu preliminară
procesarea imaginii. Judecând după rezultate, filtru
credința a eșuat

Deci, lansați utilitarul și mergeți la site-ul revistei. Vedem lista Știri proaspete, Du-te la primul lucru care a căzut și defilați la locul unde vă puteți lăsa comentariul. Da, comentariul este atât de ușor de adăugat (ar fi în continuare, dar pentru o lungă perioadă de timp toate cele deja dormite) - trebuie să introduceți un cod PIN. Ei bine, verificați dacă este posibil să o automatizați. Copiați adresa URL a imaginii și introduceți-o în șirul de adrese al TESSERCAP. Specificăm că trebuie să încărcați 12 pe capace și faceți clic pe Start. Programul a încărcat ascultat 12 imagini și a încercat să le recunoască. Din păcate, toate cappii nu au fost recunoscute, așa cum este evidențiat de inscripția -f.Failed - sub ele sau nu sunt recunoscute. În general, nu este surprinzător, deoarece summ-uri străine Și distorsiunile nu au fost îndepărtate. Acum ne vom ocupa. Faceți clic pe clic dreapta pe unul dintre cele 12 fotografii descărcate și trimiteți-l în sistemul de pre-procesare (trimiteți la preprocesorul de imagine). Am examinat cu atenție toate cele 12 per capace, vedem că ele conțin doar numere, astfel încât să mergem la fila Opțiuni și să specificăm că numai numerele trebuie să recunoască (setul de caractere \u003d numeric). Acum puteți accesa fila de preprocesare a imaginii pentru a seta filtrele. Imediat voi spune că au jucat cu primele trei filtre ("Inversiune de culoare", "schimbare de culoare", "tonyscale"), nu am văzut nici un efect pozitiv, așa că am lăsat acolo totul în mod implicit. Am ales masca de mască netedă și am setat numărul de pasaje egale cu unul. Filtrul cu găleți de gri, am pierdut și am trecut imediat la setarea de tăiere. Am ales valoarea lui 154 și am indicat că acei pixeli care sunt mai puțin necesari pentru a fi stabiliți în 0 și cei pe care mai mulți, în 255. pentru a scăpa de punctele rămase, au pornit tăierea și schimbarea lățimii de margine la 10. Ultimul Filtrul nu a inclus sens, așa că am apăsat imediat după rezolvare.

Pe un PIN, am avut un număr 714945, dar programul a recunoscut-o ca 711435. Acest lucru, după cum puteți vedea, complet incorect. În cele din urmă, așa cum am știut, nu am lucrat în mod normal. A trebuit să experimentez cu Pastebin.com, care au reușit să recunoască fără probleme. Dar dacă vă luminezi și răbdări și veți putea obține recunoașterea corectă a campaniei de pe site, apoi veți ajunge imediat la fila Opțiuni și activați pre-procesarea imaginilor (Activați preprocesarea imaginii). Apoi, du-te la Main și, făcând clic pe Start, încărcați o porțiune proaspătă a capului, care va fi acum pre-procesată de filtrul dvs. După lucrările programului, verificați limitarea corectă / incorectă recunoscută (marcați ca fiind corectă / marcată ca butoane incorecte). De acum înainte, puteți să vă uitați la statisticile de recunoaștere consolidată utilizând statisticile de afișare. În general, acesta este un raport special cu privire la securitatea unei anumite CAPTCHA. Dacă există o întrebare despre alegerea uneia sau a unei alte soluții, atunci cu ajutorul tessercap este posibil să-și petreacă propriul teste.

CAPTCHA Rezultatul pe site-uri populare

Site-ul web și Share Cross Recunoscut:

  • Wikipedia\u003e 20-30%
  • EBay\u003e 20-30%
  • reddit.com\u003e 20-30%
  • CNBC\u003e 50%
  • foodNetwork.com\u003e 80-90%
  • dailymail.co.uk\u003e 30%
  • megaupload.com\u003e 80%
  • pastebin.com\u003e 70-80%
  • cALESE.COM\u003e 80%

Concluzie

Imaginile CAPTCHA sunt unul dintre cele mai eficiente mecanisme pentru protejarea aplicațiilor web de umplerea automată a formularelor. Cu toate acestea, capacele slabe vor fi capabile să protejeze împotriva roboților aleatorii și nu stau în fața încercărilor vizate de a le rezolva. Ca și algoritmii criptografici, imaginile CAPTCHA, testate cu atenție și asigurând un nivel ridicat de securitate, sunt cele mai multe cea mai buna cale protecţie. Pe baza statisticilor că autorul programului listat, am ales-o pe recaptcha pentru proiectele mele și o voi recomanda tuturor prietenilor mei - sa dovedit a fi cel mai rezistent din testat. În orice caz, nu trebuie să uitați că există multe servicii care oferă o soluție semi-automată CAPTCHA. Printr-un API special, treceți imaginea la serviciu și returnează o soluție într-un timp scurt. Decide o persoană de repulsie (de exemplu, din China), obținându-și banii pentru el. Nu există nici o protecție aici. 🙂.