Kako napisati program za prepoznavanje zatvaranja. Automatsko prepoznavanje Capper usluge. Dobivanje imena polja

Ako često radite s uslugama koje zahtijevaju prepoznavanje zatvaranja, prije ili kasnije početi razmišljati o tome kako je taj proces automatiziran. Posebno, to se odnosi na one korisnike koji rade s iMacros skriptima.

Na primjer, koristite skripta imacros. Za automatsko prehranite oglase za besplatne oglasne ploče (ili ručno postavite oglase), a na svakoj ploči morate ući u iglu.

Zapravo, ovaj zadatak je biti vrlo lako riješiti uz pomoć automatskog prepoznavanja anti-captcha capping.

Usluga vam omogućuje da automatski rješavate izravno u pregledniku. Da biste to učinili, morate instalirati dodatak preglednika i, ako je potrebno, postavite za svoje potrebe.

Prilikom ulaska na stranicu koja sadrži PIN, dodatak će ga automatski otkriti i poslati ga za prepoznavanje (možete otkazati ovu opciju u postavkama dodatka).

Ogromna prednost je sposobnost rješavanja bušotine recaptcha. Instaliran dodatak i zaboravio je kako odabrati slike s putokazima, kuće itd.

Primjer automatskog prepoznavanja Recaptcha s dodatkom.

Slanje captcha na priznanje.

Nakon nekoliko sekundi, CAPTCHA je riješen.

Još nekoliko primjera.

Otopine kape yandex.

Odluka CAPTCHA na ploči Biltena.

Na isti način, možete riješiti druge capps, kao što je captcha vkontakte ili capp stan na Bitcoin dizalicama, itd.

Ako, plug-in ne vidi CAPTCHA, možete koristiti izbornik da biste ga pritisnuli i polje za unos za CAPP.

Cijene u usluzi su iste kao iu svim takvim uslugama. Minimalna cijena za 1000 poderanih kapica je 0,7 USD. Prosječno vrijeme razgradnje jednog CAPP-a je 8 sekundi.
Možete obnoviti račun u sustavu bilo koji na prikladan način od terminalnih i elektroničkih valuta prije banaka.

Najviše očekivano i opsežno ažuriranje ove godine: mehanizmi za obradu novih verzija foruma i platforme na blogu ažuriraju se, baza podataka odgovora na pitanja antibota (TextKapchy) povećava se za 60.000 novih texcapsa, zahvaljujući čiji je učinkovitost Xrumer je porastao na desetke puta, što je jasno pokazalo usporedne testove. Ažuriranje uključuje više od 100 poboljšanja i ispravaka.

20. kolovoza 2019. godine.

Xrumer 18.0 - 18.0.1

Xrumer Velikih ažuriranja, koji je značajno razvio logiku registracije profila na različitim platformama, poboljšana operacija s Bitrixom, Joomla platformama, Wordpress forum, MYBB, vBulletin, Xenforo, dodao je mehanizam za mijenjanje poslanih tekst, ovisno o Predmet stranice primatelja (nova makro # tema), ažurira i proširila prateće baze - ukupni volumen premašio 8 milijuna mjesta, poboljšani rad s HTTPS-om i Google Recaptcha-2, i još mnogo toga ...

26. siječnja 2019. godine.

Xrumer 16.0.18 + SocPlugin 4.0.63

Priložene baze se provjeravaju i ažuriraju, ukupni volumen se povećava na 8 (!) Milijuni podržanih resursa - blogovi, forumi, knjige gostiju, odbori, BBS, CMS i druge platforme. Baza poznatih textcapsa povećana je za više od 2.000 novih odgovora na pitanja antibota i sada iznosi 324.000 textcapsa. Značajno je poboljšana stabilnost i brzina rada, potrošnja troškova optimizirana: strop donosi do 500 ili više potoka (ovisno o načinu rada). Poboljšani rad s HTTPS-om. I glavno poboljšanje ključa: učinkovitost osobnih poruka je više puta povišena - način masppm. Plus, mnoga druga poboljšanja i korekcije :)

14. rujna 2018. godine.

Morate omogućiti da JavaScript radi ispravno

Prepoznavanje kaptura / Automatska CAPP podrška

Zasigurno je gotovo svi došli na natpis kada se registriraju na bilo kojem mjestu: "Unesite broj koji vidite" i iskrivljena slika. Ovo je olovka (captcha, pictocode, ulaznica) - grafička zaštita osmišljena za razlikovanje ljudi i programa.

U procesu njegovog rada, Xrumer program može prepoznati capping, automatski preuzimanje slike i dešifriranje. Kao što je praksa pokazala, ne traje više od 1-1,5 sekundi da dešifrira ovu vrstu, a obično manje na računalu s procesorom s radnom frekvencijom od 1 GHz. Promet na njemu ostavlja vrlo malo, jer Takve slike su "vaganje" ne više od 3-5 kb.

Ali to nije sve! Novi Xrumer 19.0.3 Elite Sada je sposobna prepoznati i zaobići čak i takve vrste kape kao što su recaptcha i dle! ALI opći popis prepoznatljivih vrsta povećao se više nego dvostruko više u odnosu na Xrumer 5.0:

A to nisu sve vrste, ovdje nema vrlo trivijalnih kape, koje su korištene u ranim verzijama foruma i još uvijek su ostali na mnogim od njih. Xrumer automatski prepoznaje vrstu capping i koristi algoritmu koji odgovara ovom tipu.

Pozdrav, Dragi Blog Readers web stranice. Antikapcha (Privremeno je bio Antgate) - to je višenamjenska platforma za automatsko prepoznavanje tzv.

Približno svaka druga web-lokacija na svijetu prisiljena je pribjegavati takvim mjerama zaštite kada se otkriju sumnjiva aktivnost robota. Usjev za blog, na primjer, izbjegava pojavu mase iste vrste poruka, čestim knjiženjem i oglašavanju u komentarima.

Svi ovi roboti stvaraju znatan teret na web-lokacijama, a CAPTCHA je super za ulogu ljudskog otkrivanja među vojnikom boce. Međutim, svaka se radnja protivi. Postoje ljudi koji moraju riješiti captcha stalno (oni koji koriste poseban softver za masovne registracije, analizirajući rezultate pretraživanja itd.).

To je samo takve ljude i predlaže se sustav automatskog solonja tih uzgrada - AntiMaptcha., Imaju cijelu vojsku radnika (oni su postavljeni - ovo je obrnuta strana antikapchi). Popustimo se s time kako koristiti anti-captcha resurs i da će biti potrebno za to.

Što je captcha i zašto se pojavljuje?

Također, Antga može biti korisna pri promicanju usluge ili stranice u društvenoj mreži koristeći vlastitu skriptu. U riječi, područja primjene su mnogo toga što razlikuje ovaj resurs iz analoga, izoštren pod čisto 2-3 funkcije i uz visoke cijene.

Kako raditi s Antikapcha uslugom

Prije izrade prve narudžbe prođite kroz malu registraciju.

Bit će potrebna samo e-pošta. Lozinka će joj doći.

Onda je potrebno top Up ravnoteža na usluzi. Minimalna granica je od jednog centa, koja je dovoljno velika za test anti-kapchi funkcija. Osim toga, možete iskoristiti posebnu ponudu: prvi captcha će biti riješen besplatno.

Daljnje kapice koštaju od 0,001 USD (uobičajeno) na 0,002 USD (Google recaptcha). Ne zaboravi kopirajte API ključkoji se generira u automatski način rada, Naći ćete ga na glavnoj stranici resursa.

Preuzmite AntiGate aplikaciju na računalo (možete to učiniti na službenoj web-lokaciji) i aktivirati automatsku traku za okidanje CAPP-a. Da biste razjasnili statističke podatke, obratite pozornost na izbornik. Nalazi se u desnom kutu stranice.

Možete napuniti stanje na glavnom klikom na gumb "Top Up račun". Alternativno rješenje - Otvorite stavku "Financije" u izborniku i kliknite na "Top Up račun" tamo. Postupak možete upravljati izravno iz izbornika Postavke. Na primjer, za promjenu informacija na vašem računu.

Za rad bilo je ugodnije, koristite dodatne alate koji se također mogu naći u izborniku. Uz pomoć prozora "Pomoć", možete vidjeti uslužnu dokumentaciju, kao i čitati projektne vijesti, pronaći odgovore na sva pitanja o Antikapchiju.

Kontaktirajte programere

Ako imate bilo kakvih pitanja o radu web-lokacije ili aplikacije, uvijek možete pisati programerima. Službena adresa Antikapchi - [Zaštićeno e-poštom]

Postoji i nekoliko specijaliziranih foruma na kojima se možete konzultirati s korisnicima web-lokacije. Možete ih pronaći pomoću bilo koje tražilice.

Sustav upućivanja

U uvjetima sustava upućivanja, kreatori usluge reagirali su s posebnom pažnjom. Zato ako planirate zaraditi vlastite preporuke, svakako pročitajte pravila. Nekoliko ih je, a oni su jednostavni u izvedbi, ali u slučaju nepoštivanja obveza, nećete moći povećati svoje prihode.

Sučjunci mogu biti sljedeći:

  1. Neaktivni sudnici - registrirani u sustavu, ali ne i korisnički ugodan sredstva.
  2. Aktivni korisnici koji su prošli registar, ali s malim brojem narudžbi - ne više od pedeset Kip tjedno.
  3. Izrada troškova - računi koji naručuju slom od pedeset Kipa i više tjedno.
  4. Izrada troškova putem aplikacije - korisnici koji su također naručili slom kapi (više od 50 komada), ali putem posebnog uslužnog programa "AppCenter".

Pozivanje novih kupaca možete zaraditi 10% preporuka ", što izdaje troškove" i 5% izdataka putem aplikacije. " Za sredstva morate imati najmanje pet suštica s povećanim statusom (aktivni korisnici koje ste privukli web-lokacijom). Odmah nakon učitavanja Cappitch, bit ćete navedeni u određenom iznosu.

Broj pozvanih preporuka nije ograničen na pravila, ali reference preporuke iz jednog korisnika ne mogu biti više od deset komada.

Sažetak

Resurs "Antikapcha" idealan je za masovnu mailing i promociju na raznim mjestima. Niski troškovi usluga i mogućnost zarađivanja preporuka moraju koristiti. Pokretanje novih korisnika možete uštedjeti na ploči za dekodiranje kapple.

Rezultat je prilično pristupačan i čak jeftin rješenje za SEO majstora i SMM. Što drugo? Osim ako ne možete vidjeti (u suštini, to je njihov glavni konkurent).

Sretno ti! Na dvosmislene sastanke na web stranicama na blogu

Vi svibanj biti zainteresirani

Captcha (captcha) - što je i za ono što se koristi
FAQ i FAQ - Što je to?
Povratne informacije za web-lokaciju koristeći skripte obrazaca na HTML-u i PHP-u, kao i online dizajneri i generatori
Radikalni - Besplatno Foto hosting s brzom i jednostavno preuzimanje fotografija kroz radikal.ru Što je bot - cilj stvaranja, sorti programa i primjera uporabe Kako ukloniti poštu i poštanski sandučić na mail.ru, yandex i gmail Bitfun - kako zaraditi sathi na popularnom bitcoin dizali Internetska anketa - od Interneta je dodijeljena među ostalima plaćeni upitnici + 10 Secrets povećava zaradu na njemu Bonusbitcoin - Bitcoin dizalica s izvrsnim pregledima Google Translate - prijevod s fotografije, unos glasa, izraza, izvanmrežni način i još mnogo toga

Ove tehnike koje ću pokazati na eksperimentalnom Kap. Kao Guinea, izabrao sam priključak nekih rafota na koje sam naišao kad sam tražio materijale za prethodni članak.

Primjer generiranog zatvaranja:

Pozadina koju sam morao koristiti, jer autor nije objavio izvornika (ili ga nisam pronašao), ali to neće utjecati na rezultat.

Pretproces

Kao rezultat ove akcije, dobit ćemo masimalno ošišan dio jednobojne slike s tekstom.

Prije svega trebamo odvojite pozadinu od teksta, Analiziramo kod za generiranje slike i koda. Postoje prve pogreške:

  • Koristi jednu boju za cijeli test koda
  • Boja za tekst generira se u rasponu Rand (0, 200), 0, RAND (0, 200), za R g B, respektivno (dovoljno je istaknuti boje samo u tom rasponu)
  • Pozadina s mnogo različitih boja (neće moći utjecati na statistiku najčešće korištene boje)

Sada, na temelju tih činjenica, analizirajte boju svakog piksela na cijeloj slici i dodijelite najčešće korištene. Otvoren 8c0074. (u hex-obrascu). Pitamo mu malu pogrešku i dodijeli ovu boju i malo slično, uzimajući u obzir pogrešku. Sva odabrana boja crna, ostalo su bijele. Ispada takve slike:

Kao što možete vidjeti, dobili smo tekst, praktički bez izobličenja. Istina, jedna linija je ostala, ali imamo lukav algoritam podrezivanja (o tome ispod), na koji ovaj liniju neće moći utjecati.

Sada označavamo zaplet s kodom.
Budući da je naš tekst najmračnije mjesto, onda se pokušavamo algoritski pronaći mrlje. Prvo, određujemo horizontalne granice:

Sada definiramo granice vertikalnim:

Linija je ostala ovdje jer je i još uvijek percipira funkcija kao vrlo tamno područje. Ali sada, na temelju tih granica, navodemo ih prema drugom krugu, horizontalno:

I zašto sada je ta linija uklonjena? Budući da je sada analiziran manje "pixel stupovima" i kada je analiziranje algoritam otkrio da u ovom dijelu ima previše stupaca s jednim crnim pikselom, i stoga je to buka. Sada određujemo granicu okomito:

Budući da je područje definicije postalo manje, sada je ta linija bila buka tamnog mjesta i uklonjena je uopće. Tako smo dobili zaplet s tekstom. Naravno, ovaj algoritam ponekad ne s pravom ne dodjeljuje Željeno područje, No, prema mojim testovima, broj nepravilnih definicija ne prelazi 5% nego što se zapravo može zanemariti.

Segmentacija

Sada je naš zadatak podijeliti rezultirajuću sliku odvojena područja sa simbolima.

Naravno, možete računati, tražiti granice znakova i tako dalje. Ali ako ponovno analizirate generiranje kod, možete pronaći drugu pogrešku.

  • Udubljenje između svakog sila je uvijek jednaka 15 piksela

Naravno, ponekad zbog veličine likova, nadilaze petnaest piksela, onda morate odgristi iz susjednog simbola još jednog ili dva piksela. Ali to nije kritično. Općenito, podijelimo sliku:

Sada kao što vidimo oko nekih likova postoji prazno područje. I još uvijek trebamo sam simbol. Nanesite funkciju trima za svaki znak, a rezultirajuće slike uklapaju u pravokutnike od 17 × 27:

To je takve slike odvojeno će se primijeniti na prepoznavanje.

Priznanje

Priznanje ćemo proizvesti bez novodnevnih neuronskih mreža. Zašto? Odlučujuću ulogu odigrala je ono što ne postoji jedinstvena vrijednost u sustavu Windows. Koristit ćemo uobičajeno priznanje maski znakova.

Za to mi, imamo pristup izvorni kodovi, Ja napraviti hrpu crnih i bijelih slika za svaki simbol s različitim kutovima skretanja (od dva do četiri stupnja) i različite veličine fontova (od 20pt do 30pt). Svaka je dobila slika, kao što ste pogodili, uklapaju se u pravokutnik od 17 × 27. Svaka primljena slika naziva se maska.

Za svako pismo sam zadržao 10-15 maski. Načelo toga je dovoljno, ali ako povećate broj maski, možete povećati postotak prepoznavanja.

Općenito, sve slike se uspoređuju s ulazom, u usporedbi s maskama, a algoritam određuje koja maska \u200b\u200bnajviše odgovara našoj slici, na temelju toga, čineći zaključak o tome koji je simbol napisan na slici.

rezultati

Za test sam dobio korištenje generiranja slike i cijepanje na simbolima od 200 ribarskih znakova. I programbilly je pokrenuo test. I pozornost!
Ishod: Uspješno: 172 Pogreške: 28 posto: 86%
To jest, svaki simbol na kapima će se uspješno prepoznati s vjerojatnošću 86% !

Malo matematike. Izračunajte postotak vjerojatnosti uspješnog prepoznavanja zatvaranja:
Za 4-simbole: 0,86 ^ 4 \u003d 54%
Za 5-simbole: 0,86 ^ 5 \u003d 47%

Prosjed Svake sekunde Capcha će biti uspješno prepoznat.

Ako uzmete u obzir da svaki captcha ima oko 1 sekundu, a 2 sekunde će biti u prosjeku za uspješno priznavanje. Ovo je vrlo izvrstan rezultat.

Izvori

Sam skriptu generira, a isti prepoznaje Capper. Primjer skripte na slici u nastavku autora Cappic:

(Slika koja se može kliknuti)

Postoje različiti načini kaptchakoji su zaštićena mjesta. Prvo, postoje posebne usluge koje koriste jeftini ručni rad i doslovno za $ 1 ponudu za rješavanje 1000 po kapici. Alternativno, možete pokušati napisati inteligentni sustav koji, prema određenim algoritama, bit će prepoznat. Potonji se sada može provesti pomoću posebnog uslužnog programa.

Riješite CAPTCHA.

CAPTCHA prepoznavanje - zadatak je najčešće nerivijalan. Sliku koju trebate primijeniti za mnoge različite filtre za uklanjanje izobličenja i smetnje, koje programeri žele ojačati sigurnosni otpor. Često je potrebno provesti studentski sustav na temelju neuronske mreže (To, usput, nije tako teško, kao što se može činiti) kako bi se postigao prihvatljiv rezultat na automatiziranoj otopini CAPP-a. Da bi shvatio o čemu govorim, bolje je podići arhivu i pročitati prekrasne članke "hakiranje captcha: teorije i praksu. Razumijemo kako se kape razbijaju "i" mi ćemo vidjeti i prepoznati. Hakiranje captcha filtera "od # 135 i # 126 soba. Danas vam želim reći o razvoju Tessercap, koji autor poziva univerzalno narezane captcha. Znatiželjna stvar, bez obzira koliko je cool.

Prvi pogled na Tessercap

Što je autor programa? Izgledao je, kao što je obično prikladan za problem automatizirane CAPTCHA rješenja i pokušao sažeti ovo iskustvo u jednom alatu. Autor je primijetio da ukloniti buku s slike, to jest, rješenja za najviše složeni zadatak Kada prepoznajete CAPP, isti filtri se najčešće koriste. Ispada da ako implementirate prikladan alat koji omogućuje bez složenih matematičkih transformacija za primjenu filtera na slike, i kombinirajte ga s OCR sustavom za prepoznavanje teksta, onda možete dobiti potpuno učinkovit program. To je zapravo učinio Gurs'ev Singh Calra iz McAfeea. Zašto je to trebalo? Autor uslužnog programa odlučio je provjeriti koliko su kapici velikih resursa. Za testiranje odabrane su te internetske stranice, koje su najposjećenije prema verziji poznate usluge statistike. Čudovišta kao što su Wikipedia, eBay, kao i Recapptcha pružatelj, postali su kandidati za sudjelovanje u testiranju.

Ako u općim uvjetima smatramo načelom funkcioniranja programa, onda je vrlo jednostavno. Izvorni zatvarač ulazi u sustav prije obrade slika koje čisti put od bilo kakve buke i izobličenja i transportera prenoseće slike sustava OCR, koji pokušava prepoznati tekst na njemu. TesserCap ima interaktivno grafičko sučelje i ima sljedeća svojstva:

  1. Ima univerzalni sustav za prethodne slike koje se mogu konfigurirati za svakog pojedinog CAPP-a.
  2. Uključuje sustav prepoznavanja tesserakta koji dohvaća tekst iz prethodno analizirane i pripremljene CAPTCHA slike.
  3. Podržava uporabu različitih kodiranja u sustavu prepoznavanja.

Mislim da je opće značenje jasno, pa pretpostavljam da vidim kako izgleda. Univerzalnost korisnosti nije mogla dovesti do komplikacija njegovog sučelja, tako da program programa može ući u mali stupor. Dakle, prije nego što nastavite izravno na prepoznavanje križa, predlažem se da se bavim njezinim sučeljem i postavljenim funkcionalnošću.


Preliminarna obrada i ekstrakcija slika
tekst CAPP-a

Oko

Nismo mogli reći barem nekoliko riječi o autoru prekrasnog TESSERCAP Utility. Njegovo ime je Gurs'ev Singh Calra. Djeluje kao glavni konzultant u Odjelu Foundstone Professional Services, koji je uključen u McAfee. Gursyev je nastupio na takvim konferencijama kao Toorcon, Nullcon i Clubhack. On je autor Tessercap i Sslsmart alata. Osim toga, razvio je nekoliko alata za unutarnje potrebe tvrtke. Omiljeni programski jezici - Ruby, Ruby na tračnicama i c #. Odjel Foundstone® Professional Usluge u kojoj radi, nudi organizacije stručne usluge i obuku, osiguravaju trajnu i učinkovitu zaštitu njihove imovine od najozbiljnijih prijetnji. Tim divizije stručnih usluga sastoji se od priznatih stručnjaka u području sigurnosti i programera koji imaju bogato iskustvo suradnje s međunarodnim korporacijama i državom

Sučelje. Glavni tab

Nakon pokretanja programa, pojavljujemo se prozor s tri kartice: glavni, opcije, predobrada slike. Glavna kartica sadrži kontrole koje se koriste za pokretanje i zaustavljanje testa CAPTCHA-slike, formiranje test statistike (koliko je deponiran i koliko), navigacija i odabir slike za prethodnu obradu. U polju URL-a (kontrolni broj 1), točan URL mora biti naveden da web aplikacija koristi za izdvajanje CAPP-a. URL se može dobiti na sljedeći način: Kliknite na desnu stranu CAPTCHA-slike, kopirajte ili pregledajte kod stranice i uklonite URL iz SRC atributa slike oznake slike .. Site / Common / ocijenje / captcha.asp? U blizini adrese je element koji traži da se broj kapica preuzme za testiranje. Budući da aplikacija može istovremeno prikazati samo 12 slika, pruža elemente kontrole za prijevaru stranice. Dakle, s velikim testiranjem, moći ćemo se pomicati kroz napunjene kapice i pregledati rezultate njihovog prepoznavanja. Počete i zaustavljaju se gumbe i zaustavljaju se testiranje. Nakon testiranja, morate procijeniti rezultate prepoznavanja slika, primijetati svaki od njih kao ispravan ili netočan. Pa, potonje, najznačajnija funkcija se koristi za prijenos bilo koje slike u sustav prije obrade, u kojem je određen filtar koji uklanja buku i izobličenje od slike. Da biste prenijeli sliku na sustav prije obrade, morate kliknuti na željenu sliku s desnom tipkom miša i odaberite Pošalji na sliku Preprocessor u kontekstnom izborniku.

Sučelje. Kartica Opcije

Kartica Opcije sadrži različite kontrole za konfiguriranje TesserCAP-a. Ovdje možete odabrati OCR sustav, postaviti web-proxy postavke, uključiti slike prosljeđivanja i pre-obrade, dodavati prilagođene HTTP zaglavlja, kao i odrediti raspon znakova za sustav prepoznavanja: brojevi, slova u donjem slučaju, slova u Gornji slučaj, posebni znakovi.

Sada o svakoj opciji detaljnije. Prije svega, možete odabrati OCR sustav. Prema zadanim postavkama, samo jedan je dostupan - Tesseract-orc, tako da se ne morate gnjaviti s izborom. Još jedan zanimljiva prilika Programi - odaberite raspon znakova. Uzmite, na primjer, CAPTCHA s mjesta - može se vidjeti da ne sadrži pismo, već se sastoji samo od brojeva. Pa zašto trebamo dodatne znakove koji će samo povećati vjerojatnost nepravilnog prepoznavanja?. Ali što ako odaberete velika slova? Hoće li program prepoznati kapicu koji se sastoji od velika slova bilo koji jezik? Ne, ne može. Program ima popis znakova koji se koriste za prepoznavanje, od konfiguracijske datotekeSmješten u programskim datotekama Fundstone Free Alati TESSSERCAP 1.0 Tessdata Configs. Objasnit ću na primjeru: Ako odaberemo brojčane i male mogućnosti, program će se obratiti donjoj sniženoj datoteci počevši od Tesdit parametra znakwhitelist. Slijedi popis znakova koji će se koristiti za rješavanje CAPP-a. Prema zadanim postavkama, datoteke sadrže samo slova latinske abecede, tako da je potrebno zamijeniti ili dodati popis znakova za prepoznavanje ćirilice.

Sada malo o tome što vam je potrebno HTTP zaglavlja zaglavlja. Na primjer, na nekim web-lokacijama trebaju biti prijavljeni, kako biste vidjeli CAPTCHA. Da biste koristili TESSERCAP kako biste dobili pristup KAP-u, program mora biti poslan u HTTP zahtjevi takve naslove kao prihvate, kolačići i preporuci, itd. Korištenje web proxy (Fiddler, Burp, Charles, WebSARB, Paros, itd.) Uhvatite poslane zaglavlja upita i unesite ih u polje za unos zaglavlja HTTP zahtjeva. Još jedna mogućnost koja je vjerojatno korisna je slijediti preusmjeravanja. Činjenica je da se zadani Tessercap ne smije preusmjeriti. Ako test URL mora slijediti sliku za dobivanje slike, morate odabrati ovu opciju.

Pa, posljednja opcija je ostala, koja uključuje / odspajanje mehanizma predistacije, koju ćemo dalje gledati. Prema zadanim postavkama, slike prije obrade su onemogućene. Korisnici prvo prilagođavaju pohranjeni pohranjeni pohranjeni pohranjeni pohranjeni u skladu s testiranjem CAPTCHA slika, a zatim aktivirajte ovaj modul. Sve CAPTCHA slike preuzete nakon uključivanja opciju Omogući sliku Omogući, presvuku predobradu i već se prenose na Tesseract OCR sustav za izdvajanje teksta.

Sučelje. Kartica Preoprocesiranje

Pa, dobili smo najzanimljiviju karticu. To je ovdje da su filteri konfigurirani za uklanjanje razne buke i zamućenja, koji pokušavaju komplicirati zadatak sustava prepoznavanja što je više moguće. Proces postavljanja univerzalnog filtra izuzetno je jednostavan i sastoji se od devet koraka. U svakoj fazi predobrade se prikazuje. Osim toga, stranica ima komponentu inspekcije koja vam omogućuje da procijenite ispravnost zatvaranja s produžnim filtrom. Detaljno razmislite o svakoj fazi.

Faza 1. Inverzija boja

U ovoj fazi su invertirane boje piksela za CAPTCHA slike. Kod ispod pokazuje kako se to događa:

Za (svaki piksel u CAPTCHA) (ako (InverTred je istinit) Novo crveno \u003d 255 - Trenutno crveno ako (Invertabblue je istinita) Novo plavo \u003d 255 - Trenutno plavo ako (Invertigen je istinita) Novo zeleno \u003d 255 - Trenutno zeleno)

Inverzija jedne ili više boja često otvara nove značajke za provjeru testne chaptcha slike.

Faza 2. Promjena boje

U ovom koraku možete promijeniti komponente boja za sve piksele slike. Svako numeričko polje može sadržavati 257 (od 1 do 255) mogućih vrijednosti. Za RGB komponente svakog piksela, ovisno o vrijednosti, sljedeći koraci se izvode u polju:

  1. Ako je vrijednost -1, odgovarajući komponenta boja ne mijenja.
  2. Ako vrijednost nije jednaka -1, pronađene su sve komponente određena boja (crvena, zelena ili plava) promjena u skladu s vrijednosti unesenom u polje. Vrijednost 0 briše komponentu, vrijednost 255 postavlja maksimalni intenzitet itd.

Faza 3. Gray gradacija (skala svjetline)

U trećoj fazi sve se slike pretvaraju u slike u Grayscale razreda. To je jedini obvezni korak pretvaranja slika koje se ne mogu propustiti. Ovisno o odabranom gumbu, izvršava se jedna od sljedećih radnji povezanih s komponentom boje svakog piksela:

  1. Prosječno -\u003e (crvena + zelena + plava) / 3.
  2. Human -\u003e (0.21 * Red + 0.71 * Zelena + 0.07 * Blue).
  3. Prosjek minimalnih i maksimalnih komponenti boja -\u003e (minimalno (crveno + zeleno + plavo) + maksimum (crveno + zelena + plava)) / 2.
  4. Minimum -\u003e Minimalno (crveno + zelena + plava).
  5. Maksimalno -\u003e maksimalno (crveno + zelena + plava).

Ovisno o intenzitetu i distribuciji komponente boja CAPTCha, bilo koji od ovih filtera može poboljšati slikovnu sliku za daljnju obradu.


Faza 4. Izglađivanje i oštrina

Za kompliciranje ekstrakcije teksta iz captcha-slika, dodaju buku u obliku pojedinačnih ili višestranih točaka, stranih linija i prostornih izobličenja. Prilikom izglađivanja slike povećava se slučajna buka, eliminirati koji se koriste kanton ili cutff filteri. U numeričkom polju, prolazi trebaju biti navedeni koliko puta trebate primijeniti odgovarajuću masku za slike prije odlaska na sljedeći korak. Pogledajmo komponente filtra za izglađivanje i povećanje oštrine. Dostupne su dvije vrste slika maski:

  1. Fiksne maske. Prema zadanim postavkama, TesserCap ima šest najpopularnijih slika maski. Ove maske mogu izgladiti sliku ili povećati oštrinu (laplace transformacija). Promjene se prikazuju odmah nakon odabira maske pomoću odgovarajućih gumba.
  2. Maske za prilagođene slike. Korisnik može konfigurirati maske za prilagođene slike unosom vrijednosti u brojčane polja i pritiskom na gumb Spremi maska. Ako je zbroj koeficijenata u ovim prozorima manji od nule, izdaje se pogreška i maska \u200b\u200bse ne primjenjuje. Prilikom odabira fiksne maske, gumb Spremi maska \u200b\u200bnije potrebna.

Faza 5. Uvesti nijanse sive boje

U ovoj fazi obrade slike, njegovi pikseli se mogu oslikati u širokom rasponu nijansi sive. Ovaj filtar prikazuje distribuciju sivih gradacija u 20 Bakencakes (Bucket) / Raspon. Postotak piksela obojenih u nijansama sive u rasponu od 0 do 12 naveden je u bakenu (kanta) 0, postotak piksela obojenih u nijansima sive u rasponu od 13 do 25 - u Bakketu (kanta) 1 , itd Korisnik može odabrati jedan od sljedećih koraka za svaki raspon vrijednosti koje odgovaraju nijansima sive boje:

  1. Ostavite kao što je.
  2. Zamijenite bijelu (bijelu).
  3. Zamijenite crno.

Zahvaljujući ovim mogućnostima, možete kontrolirati različite raspone nijansi sive, kao i izrezati / ukloniti buku promjenom nijansi sive prema bijeloj ili crnoj boji.

Korak 6. Podešavanje izreza (prekida)

Ovaj filtar gradi grafikon vrijednosti sive boje iz učestalosti pojave i ponude za odabir isječka. Načelo rada filtra za rezanje prikazano je u nastavku u pseudokodu:

Ako (Pixel's Grayscale vrijednost<= Cutoff) pixel grayscale value = (0 OR 255) -> ovisno o odabranoj opciji (<= или => : Postavite Eve piksela s vrijednošću<=/=> Prag do 0. Ostao na 255)

Grafikon prikazuje detaljnu raspodjelu captcha piksela u bojama i pomaže ukloniti smetnje rezanjem vrijednosti sive razine.

Faza 7: Tripping (sjeckanje)

Nakon nanošenja izglađivanja, prekidača, kantice i drugih captcha-image filtera, još uvijek mogu biti otpustite s jednom scenom ili višestranim točkicama, autsajderima i prostorno distorzijama. Načelo djelovanja filtra za rezanje je kako slijedi: Ako je broj susjednih piksela obojen u ovoj sjeni sive, manje od veličine u numeričkom polju, filtar kanala dodjeljuje im vrijednost 0 (crna) ili 255 (bijela) odabirom korisnika. U tom slučaju, CAPTCHA se analizira u horizontalnom i vertikalnom smjeru.

Faza 8: Promjena širine granice

Prema autoru korisnosti, tijekom početnog istraživanja i razvoja TesserCAP-a, ona je u više navrata primijetila kada Captcha-slike imaju debelu graničnu liniju i njezina boja se razlikuje od glavne pozadine CAPTCHA-a, neki OCR sustavi ne mogu prepoznati tekst. Ovaj filtar je dizajniran za obradu graničnih linija i njihovih promjena. Granice granične linije s širinom koja je navedena u numeričkom polju obojena su crnom ili bijelom odabirom korisnika.

Faza 9: Inverzija sive nijanse

Ovaj filtar prolazi svaki piksel i zamjenjuje svoju vrijednost razine sivog novog, kao što je prikazano u nastavku u pseudokodu. Inverzija sive se provodi kako bi se uklopio u sliku pod postavkama boja sustava OCR.

Za (svaki piksel u CAPTCHA) Nova vrijednost Grayscale \u003d 255 - trenutna vrijednost sivog točaka

Korak 10: Provjera prepoznavanja prepoznavanja

Svrha ove faze je prenijeti prethodno obrađenu CAPTCHA-sliku OCR sustava za prepoznavanje. Tipka za rješavanje ima sliku nakon što sivi filtar inverzije šalje na OCR sustav za izdvajanje teksta i prikazuje povratni tekst u grafičko sučelje, Ako se priznati tekst podudara s tekstom na PIN-u, tada smo ispravno postavili filtar za prethodnu obradu. Sada možete otići na karticu Opcije i omogućiti opciju pretprocesiranja za obradu svih naknadnih učitanih kapica.

Prepoznajte capps

Pa, možda smo pogledali sve mogućnosti za ovaj korisnost, a sada bi bilo lijepo testirati bilo kakvu priključak na snazi \u200b\u200b..


Rezultat analize kapiča s preliminarnim
obrada slike. Sudeći prema rezultatima, filtrirajte
vjera nije uspjela

Dakle, pokrenite uslužni program i idite na mjesto magazina. Vidimo popis svježa vijest, Idite na prvu stvar koja je pala i pomaknite se na mjesto gdje možete ostaviti svoj komentar. Da, komentar je tako lako dodati (to bi i dalje bilo, ali dugo je sve već spavalo) - morate unijeti iglu. Pa, provjerite je li moguće automatizirati. Kopirajte URL slike i umetnite ga u nizu adrese TesserCAP-a. Naveli smo da trebate učitati 12 po kapicama i kliknite Start. Program je poslušno učitao 12 slika i pokušao ih prepoznati. Nažalost, svi kapci su ili nisu prepoznali, o čemu svjedoče natpis -f.failed- pod njima ili ne prepoznat. Općenito, nije iznenađujuće, jer strana suma I izobličenja nisu uklonjeni. Ovo sada ćemo se baviti. Kliknite desnom tipkom miša na jednu od 12 preuzetih slika i pošaljite ga na sustav prije obrade (pošaljite na sliku Preprocessor). Pažljivo ispituje svih 12 po kapicama, vidimo da sadrže samo brojeve, pa idemo na karticu Opcije i navedite da samo brojevi moraju prepoznati (skup znakova \u003d numerics). Sada možete otići na karticu Preoprocesiranje slike kako biste postavili filtre. Odmah ću reći da je igrao s prva tri filtra ("boja inverzija", "promjena boje", "Grayscale"), nisam vidio nikakav pozitivan učinak, pa sam tamo ostavio po defaultu. Odabrao sam glatku masku 2 masku i postavio broj prolaza jednaka jednom. Grayscale kante filter sam propustio i odmah se uključio na postavku za isječenje. Izabrao sam vrijednost 154 i naznačila da su ti pikseli koji su manje potrebni za postavljanje u 0, a one koje više, u 255. da biste dobili osloboditi od preostalih točaka, uključili sjeckanje i promijenili širinu granice do 10. posljednje Filtar nije uključivao smisao, pa sam odmah pritisnuo na rješavanje.

Na pinu, imao sam broj 714945, ali program ga je prepoznao kao 711435. To, kao što možete vidjeti, potpuno netočan. U konačnici, kao što sam znao, nisam normalno radio. Morao sam eksperimentirati s Pastebin.com, koji su mogli prepoznati bez ikakvih problema. Ali ako prosvijetlite sebe i pacijenta, a vi ćete biti u mogućnosti da biste dobili ispravno prepoznavanje kampanje s web-lokacije, a zatim odmah dođite na karticu opcija i uključite predobradu slika (omogućite predobradu slike). Zatim idite na glavnu i kliknujući na početak, učitajte svježi dio CAPP-a, koji će sada biti unaprijed obrađeni filtrom. Nakon što program radi, provjerite ispravno / pogrešno priznati priključak (označite kao ispravnu / oznaku kao netočne tipke). Od sada možete pogledati konsolidirane statistike prepoznavanja pomoću emisije statistike. Općenito, ovo je neobično izvješće o sigurnosti određenog captcha. Ako postoji pitanje o odabiru jedno ili drugo rješenje, onda uz pomoć TesserCAP-a moguće je provesti vlastito testiranje.

Rezultat CAPTCHA Rezultat na popularnim web-lokacijama

Web-lokacija i podijelite priznati križ:

  • Wikipedia\u003e 20-30%
  • EBay\u003e 20-30%
  • reddit.com\u003e 20-30%
  • CNBC\u003e 50%
  • foodNetwork.com\u003e 80-90%
  • dailyMail.co.uk\u003e 30%
  • megaupload.com\u003e 80%
  • pastebin.com\u003e 70-80%
  • cavenue.com\u003e 80%

Zaključak

CAPTCHA slike su jedan od najučinkovitijih mehanizama za zaštitu web aplikacija od automatskog punjenja oblika. Međutim, slabe kape moći će zaštititi od slučajnih robota i ne stajati prije ciljanih pokušaja njihovog rješavanja. Kao i kriptografski algoritmi, captcha slike, pažljivo testirane i osigurati visoku razinu sigurnosti, najviše su najbolji način zaštita. Na temelju statistike koju je autor programa navrstio, izabrao sam recaptcha za moje projekte i preporučit ću ga svim mojim prijateljima - ispostavilo se da je to najtvrdonije od testiranih. U svakom slučaju, ne smijete zaboraviti da postoje mnoge usluge koje nude poluautomatsko rješenje captcha. Kroz poseban API, prenosite sliku u uslugu i vraća se rješenje u kratkom vremenu. Odlučuje odbojnu osobu (na primjer, iz Kine), dobiva svoj peni za to. Ovdje nema zaštite. 🙂