نحوه نوشتن یک برنامه برای تشخیص به رسمیت شناختن. خدمات تشخیص خودکار جمع آوری شده. به دست آوردن نام زمینه

اگر شما اغلب با خدماتی که نیاز به تشخیص را دارند، کار می کنند، پس از آن دیر یا زود شروع به فکر کردن درباره اینکه چگونه این فرآیند خودکار است، فکر کنید. به ویژه، این امر به کسانی که با اسکریپت های Imacros کار می کنند، اعمال می شود.

به عنوان مثال، شما استفاده می کنید اسکریپت imacros. به طور خودکار تبلیغات به صورت خودکار برای تابلوهای بولتن رایگان (یا قرار دادن تبلیغات به صورت دستی)، و در هر هیئت مدیره شما باید یک پین را وارد کنید.

در واقع، این وظیفه بسیار آسان است که با کمک به رسمیت شناختن خودکار Capping Anti-Captcha حل شود.

این سرویس به شما امکان می دهد به طور خودکار به طور مستقیم در مرورگر را حل کنید. برای انجام این کار، شما باید یک پلاگین مرورگر را نصب کنید و در صورت لزوم، برای نیازهای خود تنظیم کنید.

هنگام ورود به صفحه حاوی پین، افزونه به طور خودکار آن را تشخیص می دهد و آن را به رسمیت می شناسد (شما می توانید این گزینه را در تنظیمات پلاگین لغو کنید).

مزیت بزرگی توانایی حل Recaptcha Bore است. پلاگین را نصب کرده و در مورد چگونگی انتخاب تصاویر با نشانه های راه، خانه ها و غیره را فراموش کرده اید

یک مثال از recaptcha تشخیص خودکار با پلاگین.

ارسال CAPTCHA به رسمیت شناختن

پس از چند ثانیه، CAPTCHA حل شد.

چند نمونه دیگر.

کلاه های راه حل Yandex.

تصمیم گیری CAPTCHA در هیئت مدیره بولتن.

به همان شیوه، شما می توانید سایر کاپ ها را حل کنید، مانند CAPTCHA VKontakte یا CAPP مسطح در جرثقیل Bitcoin و غیره

اگر پلاگین CAPTCHA را نمی بیند، می توانید از منو برای فشار دادن آن و فیلد ورودی برای CAPP استفاده کنید.

قیمت ها در این سرویس همانند همه خدمات مشابه هستند. حداقل قیمت برای 1000 کلاه پاره شده 0.7 دلار است. میانگین زمان تخریب یک CAPP 8 ثانیه است.
شما می توانید حساب را در سیستم هر کدام را دوباره پر کنید در یک راه مناسب از ترمینال و ارزهای الکترونیکی قبل از پرداخت بانکی.

پیش بینی شده ترین پیش بینی شده و در مقیاس بزرگ در سال جاری: مکانیسم های پردازش نسخه های جدید انجمن و سیستم عامل های وبلاگ به روز می شود، پایگاه داده پاسخ به مسائل مربوط به آنتی بیوتیک (TextKapchy) با 60،000 نسخه جدید Textcaps افزایش می یابد، به طوری که اثربخشی آن Xrumer به ده ها بار افزایش یافت، که به وضوح آزمایش های تطبیقی \u200b\u200bرا نشان داد. به روز رسانی شامل بیش از 100 بهبود و اصلاحات است.

20 اوت 2019.

XRUMER 18.0 - 18.0.1

به روز رسانی Xrumer در مقیاس بزرگ، که به طور قابل توجهی منطق ثبت نام پروفایل ها را بر روی پلتفرم های مختلف تکامل یافته است، عملیات بهبود یافته با Bitrix، پلت فرم های جوملا، انجمن وردپرس، MyBB، VBulletin، XenForo، یک مکانیزم برای تغییر متن ارسال شده بسته به نوع موضوع سایت دریافت کننده (موضوع جدید ماکرو #)، به روز شده و بزرگ سازی پایگاه های همراه - حجم کل بیش از 8 میلیون سایت، بهبود کار با HTTPS و Google Recaptcha-2، و خیلی بیشتر ...

26 ژانویه 2019.

XRUMER 16.0.18 + SOCPLUGIN 4.0.63

پایگاه های همراه تایید شده و به روز می شوند، حجم کل به 8 (!) میلیون ها نفر از منابع پشتیبانی شده - وبلاگ ها، انجمن ها، کتاب های مهمان، هیئت مدیره، BBS، CMS و سایر سیستم عامل ها افزایش یافته است. پایه Textcaps معروف توسط بیش از 2000 پاسخ جدید به سوالات آنتی بیوتیک افزایش می یابد و در حال حاضر به 324،000 textcaps می رسد. پایداری و سرعت کار به طور قابل توجهی بهبود یافته است، مصرف هزینه بهینه شده است: سقف به 500 یا بیشتر جریان می رسد (بسته به حالت عملیات). کار بهبود یافته با HTTPS. و اصلی، بهبود کلیدی: کارایی پیام های شخصی بارها و بارها افزایش می یابد - حالت MassPM. به علاوه، بسیاری از پیشرفت های دیگر و اصلاحات :)

سپتامبر 14، 2018.

شما باید جاوا اسکریپت را به درستی کار کنید

تشخیص پمپ / پشتیبانی خودکار CAPP

مطمئنا تقریبا هر کس در هنگام ثبت نام در هر سایت ثبت نام کرد: "شماره ای را که می بینید را وارد کنید" و تصویر تحریف شده را وارد کنید. این یک قلم (CAPTCHA، Pictocode، Ticket) است - حفاظت گرافیک طراحی شده برای تشخیص مردم و برنامه ها.

در فرایند کار خود، برنامه Xrumer قادر به تشخیص بسته شدن، به طور خودکار دانلود تصویر و رمزگشایی آن است. به عنوان عمل نشان داده شده است، بیش از 1-1.5 ثانیه طول می کشد تا رمزگشایی این نوع، و معمولا کمتر بر روی یک کامپیوتر با یک پردازنده با فرکانس کار 1 گیگاهرتز. ترافیک آن را بسیار کم می کند، زیرا چنین تصاویری "وزن" بیش از 3-5 کیلوبایت نیست.

اما این همه نیست! جدید xrumer 19.0.3 نخبگان در حال حاضر قادر به شناخت و دور زدن حتی انواع کلاه های مانند Recaptcha و DLE است! ولی فهرست کلی انواع قابل تشخیص بیش از دو برابر بیشتر نسبت به Xrumer 5.0 افزایش یافته است:

و این همه نوع نیست، هیچ کلاهبرداری بسیار بی اهمیت در اینجا وجود ندارد، که در نسخه های اولیه انجمن ها مورد استفاده قرار گرفت و هنوز هم در بسیاری از آنها باقی مانده است. Xrumer به طور خودکار نوع بسته بندی را به رسمیت می شناسد و از الگوریتم مربوط به این نوع استفاده می کند.

سلام، وب سایت خوانندگان وبلاگ عزیز. antikapcha (به طور موقت Antgate بود) - این یک پلت فرم چند منظوره برای تشخیص خودکار به اصطلاح Cappitch (حفاظت در برابر ربات های پست خودکار، و همچنین حفاظت از موتورهای جستجو از تجزیه صدور آنها).

تقریبا هر وب سایت دوم در جهان مجبور است زمانی که فعالیت مشکوک ربات ها شناسایی شود، به چنین اقداماتی حمایت می کند. به عنوان مثال، محصول برای وبلاگ، از ظهور جرم همان نوع پیام ها، پست های مکرر و تبلیغات در نظرات اجتناب می کند.

همه این رباتها بار قابل توجهی در سایت ها ایجاد می کنند و CAPTCHA برای نقش تشخیص انسان در میان ارتش بطری عالی است. با این حال، هر اقدام مخالف است. افرادی هستند که باید به طور مداوم CAPTCHA را حل کنند (کسانی که از نرم افزار ویژه برای ثبت نام های جمعی استفاده می کنند، تجزیه و تحلیل نتایج جستجو و غیره).

این فقط چنین افرادی است و سیستم انفرادی اتوماتیک این REINS پیشنهاد شده است - Anticaptcha. آنها یک ارتش کل کارگران دارند (آنها تنظیم شده اند - این سمت معکوس Antikapchi است). بیایید با نحوه استفاده از منابع ضد CAPTCHA مقابله کنیم و این برای این لازم باشد.

CAPTCHA چیست و چرا ظاهر می شود؟

همچنین، Antgate می تواند مفید باشد در هنگام ترویج یک سرویس یا صفحات شبکه اجتماعی با استفاده از اسکریپت خود. در یک کلمه، زمینه های کاربرد بسیار زیاد است که این منبع را از آنالوگ ها متمایز می کند، که تحت عمل کاملا 2-3 توابع و با قیمت های بالا تیز شده است.

چگونه با سرویس Antikapcha کار کنیم

قبل از ایجاد اولین سفارش خود، از طریق یک ثبت نام کوچک بروید.

فقط ایمیل مورد نیاز است رمز عبور به او می آید

سپس نیاز دارد بالا بردن تعادل در خدمت حداقل محدودیت از یک سنت است که به اندازه کافی عالی برای تست توابع ضد Kapchi است. علاوه بر این، شما می توانید از یک پیشنهاد ویژه استفاده کنید: اولین CAPTCHA به صورت رایگان حل خواهد شد.

کلاه های بیشتری از 0.001 دلار (معمولی) به 0.002 دلار (Google Recaptcha) هزینه می کنند. فراموش نکن کلید API را کپی کنیدکه در آن تولید می شود حالت اتوماتیک. شما آن را در صفحه اصلی منابع پیدا خواهید کرد.

برنامه Antigate را به رایانه خود دانلود کنید (همچنین می توانید این کار را در وب سایت رسمی انجام دهید) و مسیر خودکار اتوماتیک CAPP را فعال کنید. برای روشن شدن داده های آماری، به منو توجه کنید. این در گوشه سمت راست صفحه قرار دارد.

شما می توانید تعادل را بر روی اصلی با کلیک بر روی دکمه "بالا تا حساب" دوباره پر کنید. راه حل جایگزین - مورد "مالی" را در منو باز کنید و روی "بالا بردن حساب" کلیک کنید. شما می توانید روند را مستقیما از منوی تنظیمات مدیریت کنید. به عنوان مثال، برای تغییر اطلاعات در حساب کاربری شما.

برای کار راحت تر بود، از ابزارهای اضافی استفاده کنید که می تواند در منو یافت شود. با کمک پنجره "راهنما"، می توانید مستندات سرویس را مشاهده کنید، همچنین اخبار پروژه را بخوانید، پاسخ به هر گونه سوال در مورد Antikapchi را پیدا کنید.

تماس با توسعه دهندگان

اگر سوالی در مورد کار سایت یا برنامه دارید، همیشه می توانید به توسعه دهندگان بنویسید. آدرس رسمی Antikapchi - [ایمیل محافظت شده]

چندین انجمن تخصصی وجود دارد که شما می توانید با کاربران سایت مشورت کنید. شما می توانید آنها را با استفاده از هر موتور جستجو پیدا کنید.

سیستم ارجاع

به شرایط سیستم ارجاع، سازندگان خدمات با توجه ویژه واکنش نشان دادند. به همین دلیل است که اگر قصد دارید ارجاع خود را کسب کنید، مطمئنا قوانین را بخوانید. تعداد کمی از آنها وجود دارد و آنها در عملکرد ساده هستند، اما در صورت عدم رعایت تعهدات، شما قادر نخواهید بود درآمد خود را افزایش دهید.

subarcounts ممکن است به شرح زیر باشد:

  1. زیرمجموعه های غیر فعال - ثبت شده در سیستم، اما نه بودجه کاربر لذت بخش.
  2. فعال - کاربران که ثبت نام کرده اند، اما با تعداد کمی از سفارشات - نه بیش از پنجاه کیپ در هفته.
  3. ساختن هزینه ها - حساب هایی که از پنجاه کیپ و هر هفته بیشتر می شود.
  4. ساختن هزینه ها از طریق برنامه - کاربران که همچنین دستور فروپاشی قطره ها (بیش از 50 قطعه) را سفارش دادند، اما از طریق ابزار ویژه "AppCenter".

دعوت از مشتریان جدید، شما می توانید 10٪ از ارجاعات، "هزینه های ساخت" و 5٪ از هزینه ها را از طریق برنامه کسب کنید. " برای بودجه، شما باید حداقل پنج زیرمجموعه را با افزایش وضعیت (کاربران فعال که به سایت جذب کرده اید) داشته باشید. بلافاصله پس از بارگیری کاپوچ، شما در مقدار مشخص شده ذکر شده است.

تعداد ارجاعات دعوت شده به قوانین محدود نمی شود، اما ارجاع ارجاع از یک کاربر می تواند بیش از ده قطعه باشد.

خلاصه

منابع "Antikapcha" ایده آل برای پست الکترونیکی و ارتقاء در سایت های مختلف است. هزینه کم خدمات و امکان درآمد ارجاع باید استفاده شود. در حال اجرا کاربران جدید، شما می توانید در هیئت مدیره رمز گشایی Capple ذخیره کنید.

نتیجه راه حل مقرون به صرفه و حتی ارزان برای SEO Masters و SMM است. چه چیز دیگری؟ مگر اینکه بتوانید ببینید (در اصل، این رقیب اصلی آنها است).

موفق باشی! به جلسات مبهم در وب سایت وب سایت وبلاگ

ممکن است علاقه مند باشید

CAPTCHA (CAPTCHA) - چه چیزی است و برای آنچه که استفاده می شود
پرسش و پاسخ پرسش و پاسخ - چه چیزی است؟
بازخورد برای سایت با استفاده از اسکریپت های فرم بر روی HTML و PHP، و همچنین طراحان آنلاین و ژنراتورها
رادیکال - رایگان میزبانی رایگان با عکس سریع و آسان دانلود از طریق Radikal.ru یک ربات - هدف ایجاد، انواع برنامه ها و نمونه های استفاده چگونه برای حذف ایمیل و صندوق پستی در Mail.ru، Yandex و Gmail Bitfun - نحوه کسب Satoshi در جرثقیل بیت کوین محبوب نظرسنجی اینترنت - از اینترنت در میان دیگران اختصاص داده شده است پرسشنامه های پرداخت شده + 10 اسرار افزایش درآمد بر روی آن BonusBitcoin - جرثقیل Bitcoin با بررسی های عالی Google Translete - ترجمه از عکس، ورودی صدا، phrasebook، حالت آفلاین و خیلی بیشتر

این تکنیک های من در مورد Kap تجربی نشان خواهم داد. به عنوان یک گینه، من تصمیم گرفتم که برخی از rafontes را انتخاب کنم که وقتی به دنبال ماده ای برای مقاله قبلی بودم، به آن رسیدم.

مثال از بسته بندی تولید شده:

پس زمینه من مجبور بودم از دیگر استفاده کنم، زیرا نویسنده اصلی را ارسال نکرده بود (یا من آن را پیدا نکردم)، اما بر نتیجه تاثیر نمی گذارد.

پیش پردازش

به عنوان یک نتیجه از این اقدام، ما یک بخش MasiMally برش یک تصویر تک رنگ با متن دریافت خواهیم کرد.

اول از همه ما نیاز داریم جداگانه پس زمینه از متن. ما تجزیه و تحلیل تصویر و کد تولید کد. اشتباهات اول وجود دارد:

  • یک رنگ برای آزمایش کل کد استفاده می شود
  • رنگ برای متن در محدوده RAND (0، 200)، 0، RAND (0، 200)، برای R G B تولید می شود (به اندازه کافی برای برجسته کردن رنگ تنها در این محدوده)
  • پس زمینه با تعداد زیادی از رنگ های مختلف (قادر به تاثیر بر آمار رنگ رایج ترین استفاده می شود)

در حال حاضر، بر اساس این حقایق، رنگ هر پیکسل را در کل تصویر تجزیه و تحلیل کنید و شایع ترین مورد استفاده را تخصیص دهید. باز 8C0074. (در فرم هگزا). ما از او یک خطای کوچک می خواهیم و این رنگ را تخصیص می دهیم و کمی شبیه به آن است، با توجه به خطا. همه رنگ های انتخاب شده سیاه و سفید، بقیه سفید هستند. به نظر می رسد چنین تصویری:

همانطور که می بینید، ما متن را به طور عمدی بدون تحریف دریافت کردیم. درست است، یک خط باقی مانده است، اما ما یک الگوریتم پیرایش روی حیله و تزویر داریم (در مورد آن در زیر)، که این خط قادر به نفوذ نخواهد بود.

اکنون ما یک طرح با کد را برجسته می کنیم.
از آنجا که متن ما نقطه تاریک ترین است، پس ما سعی می کنیم به الگوریتمی آن را پیدا کنیم. اول، ما مرزهای افقی را تعیین می کنیم:

در حال حاضر ما مرزهای عمودی را تعریف می کنیم:

این خط باقی مانده است زیرا هنوز توسط عملکرد به عنوان یک منطقه بسیار تاریک درک شده است. اما اکنون، بر اساس این مرزها، آنها را با توجه به دور دوم، به صورت افقی مشخص می کنیم:

و چرا اکنون این خط حذف شده است؟ از آنجا که اکنون آن را با کمتر "ستون پیکسل" تجزیه و تحلیل کرد و هنگام تجزیه و تحلیل الگوریتم نشان داد که در این بخش ستون های زیادی با یک پیکسل سیاه وجود دارد و بنابراین این سر و صدا است. حالا ما مرز را به صورت عمودی مشخص می کنیم:

از آنجا که منطقه تعریف شده کمتر تبدیل شده است، در حال حاضر این خط سر و صدا از نقطه تاریک بود و در همه حذف شد. بنابراین ما یک طرح با متن داشتیم. البته این الگوریتم گاهی اوقات به درستی تخصیص نیست منطقه مورد نظر. اما با توجه به آزمایشات من، تعداد تعاریف نادرست از 5٪ تجاوز نمی کند، نه واقعا می تواند نادیده گرفته شود.

تقسیم بندی

در حال حاضر وظیفه ما این است که تصویر حاصل را تقسیم کنیم مناطق جداگانه با نمادها

البته شما می توانید حساب کنید، به مرزهای شخصیت ها و غیره نگاه کنید. اما اگر دوباره کد تولید را تجزیه و تحلیل کنید، می توانید یک خطای دیگر پیدا کنید.

  • دندانه ای بین هر نماد همیشه برابر با 15 پیکسل است

البته، گاهی اوقات به دلیل اندازه شخصیت ها، آنها فراتر از پانزده پیکسل هستند، پس شما باید از یک نماد همسایه یکی دیگر از یک یا دو پیکسل را از بین ببرید. اما این مهم نیست. به طور کلی، ما تصویر را تقسیم می کنیم:

در حال حاضر همانطور که در اطراف برخی از شخصیت ها می بینیم یک منطقه خالی وجود دارد. و ما هنوز به نماد خود نیاز داریم. تابع TRIM را برای هر شخصیت اعمال کنید و تصاویر حاصل شده به مستطیل های 17 × 17 × 17:

این تصاویر به طور جداگانه به منظور شناخت اعمال می شود.

به رسمیت شناختن

به رسمیت شناختن ما بدون شبکه های عصبی جدید تولید می کنیم. چرا؟ نقش قاطع توسط چه چیزی، یک کتابخانه ارزشمند در زیر پنجره ها وجود نداشت. ما از شناخت معمول در ماسک شخصیت ها استفاده خواهیم کرد.

برای این ما، داشتن دسترسی به کد های منبع، من یک دسته از تصاویر سیاه و سفید را برای هر نماد با زوایای مختلف چرخش (از دو تا چهار درجه) و اندازه فونت های مختلف (از 20pt تا 30pt) ایجاد می کنم. هر عکس حاصل می شود، همانطور که حدس زدید، به یک مستطیل 17 × 27 می رسد. هر تصویر دریافت شده یک ماسک نامیده می شود.

برای هر نامه ای که من 10-15 ماسک داشتم. اصل این کافی است، اما اگر تعداد ماسک ها را افزایش دهید، می توانید درصد تشخیص را افزایش دهید.

به طور کلی، تمام تصاویر با ورودی مقایسه می شوند، در مقایسه با ماسک ها، و الگوریتم تعیین می کند که کدام ماسک بیشتر با تصویر ما مطابقت دارد، بر اساس این، نتیجه گیری در مورد نماد نماد در تصویر نوشته شده است.

نتایج

برای آزمون، من با استفاده از نسل تصویر دریافت کردم و تقسیم بر نمادهای 200 شخصیت های ریش دار. و برنامه ریزی تست را راه اندازی کرد. و توجه!
نتیجه: موفقیت: 172 خطا: 28 درصد: 86 درصد
به عبارت دیگر، هر نماد در کلاه ها با موفقیت با احتمال موفقیت شناخته می شود 86% !

ریاضیات کمی درصد احتمال احتمال تشخیص موفقیت آمیز را محاسبه کنید:
برای کلاه های 4 نماد: 0.86 ^ 4 \u003d 54%
برای کلاه های 5 نماد: 0.86 ^ 5 \u003d 47%

میانگین هر ثانیه Capcha با موفقیت شناخته خواهد شد.

اگر فکر می کنید که هر CAPTCHA حدود 1 ثانیه دارد و 2 ثانیه به طور متوسط \u200b\u200bبرای تشخیص موفقیت آمیز خواهد بود. این یک نتیجه بسیار عالی است.

منابع

این اسکریپت تولید می کند و همان کادر را تشخیص می دهد. یک مثال از یک اسکریپت بر روی تصویر زیر توسط نویسنده Cappic:

(تصویر کلیک کنید)

راه های مختلفی وجود دارد کپککه سایت های محافظت شده هستند اول، خدمات ویژه ای وجود دارد که از کار ارزان قیمت استفاده می کنند و به معنای واقعی کلمه برای پیشنهاد 1 دلار برای حل 1000 در هر کلاهک استفاده می شود. به طور خلاصه، می توانید سعی کنید یک سیستم هوشمند بنویسید که طبق الگوریتم های خاص، خود را به رسمیت شناخت. اکنون می توانید با استفاده از یک ابزار خاص اجرا شود.

حل CAPTCHA

تشخیص CAPTCHA - وظیفه اغلب غیر معمول است. تصویر شما نیاز به اعمال بسیاری از فیلترهای مختلف برای حذف اعوجاج و تداخل، که توسعه دهندگان می خواهند مقاومت امنیتی را تقویت کنند. اغلب لازم است که سیستم دانشجویی بر اساس آن را اجرا کنیم شبکه های عصبی (این، به هر حال، به نظر می رسد بسیار دشوار نیست، زیرا ممکن است به نظر برسد) برای رسیدن به یک نتیجه قابل قبول در راه حل خودکار CAPP. برای درک آنچه که من در مورد آن صحبت می کنم بهتر است بایگانی را بالا ببریم و مقالات فوق العاده "هک کردن CAPTCHA را بخوانید: نظریه و عمل. ما درک می کنیم که چگونه کلاه ها را شکست می دهند "و ما شاهد خواهیم بود. هک کردن فیلترهای CAPTCHA "از # 135 و # 126 اتاق. امروز، من می خواهم به شما در مورد توسعه TesserCap بگویم، که نویسنده CAPTCHA Universal Sliced \u200b\u200bرا می خواند. چیز کنجکاو، مهم نیست چقدر سرد است.

ابتدا به TesserCAP نگاه کنید

نویسنده برنامه چیست؟ او نگاه کرد، به طور معمول برای مشکل راه حل خودکار CAPTCHA مناسب بود و سعی کرد این تجربه را در یک ابزار خلاصه کند. نویسنده متوجه شد که برای حذف سر و صدا از تصویر، یعنی راه حل های بیشتر وظیفه پیچیده هنگام تشخیص CAPP، فیلترهای مشابه اغلب استفاده می شود. به نظر می رسد که اگر شما یک ابزار مناسب را اجرا کنید که اجازه می دهد بدون تحولات ریاضی پیچیده برای اعمال فیلترها در تصاویر، و ترکیب آن با یک سیستم OCR برای تشخیص متن، شما می توانید یک برنامه کاملا کارآمد را دریافت کنید. این، در واقع، Gurs'ev Singh Calra از McAfee ساخته شده است. چرا به آن نیاز داشت؟ نویسنده این ابزار تصمیم گرفت تا کلاه های اصلی منابع را بررسی کند. برای آزمایش، این سایت های اینترنتی انتخاب شده اند، که بیشترین بازدید را براساس نسخه سرویس آمار معروف بازدید می کنند. هیولای مانند ویکی پدیا، ای بی، و همچنین ارائه دهنده Recapptcha، نامزدها برای شرکت در آزمایش شدند.

اگر ما به طور کلی، اصل عملکرد برنامه را در نظر بگیریم، بسیار ساده است. بسته بندی منبع وارد سیستم پیش پردازش تصاویری می شود که مسیر را از هر سر و صدا و اعوجاج و نوار نقاله تصویر منتقل شده از سیستم OCR پاک می کند، که تلاش می کند متن را بر روی آن تشخیص دهد. TesserCAP دارای یک رابط گرافیکی تعاملی است و دارای ویژگی های زیر است:

  1. این سیستم جهانی برای پیش پردازش تصاویر است که می تواند برای هر CAPP شخصی پیکربندی شود.
  2. شامل یک سیستم تشخیص TessSeract است که متن را از تصویر CAPTCHA قبلا تجزیه و تحلیل کرده و آماده شده است.
  3. پشتیبانی از استفاده از کدگذاری های مختلف در سیستم تشخیص.

من فکر می کنم معنای عمومی روشن است، بنابراین من پیشنهاد می کنم ببینید که چگونه به نظر می رسد. جهانی بودن ابزار نمی تواند منجر به عوارض رابط کاربری شود، بنابراین پنجره برنامه می تواند به یک استپور کوچک وارد شود. بنابراین، قبل از ادامه به طور مستقیم به رسمیت شناختن صلیب، پیشنهاد می کنم با رابط کاربری آن و عملکرد گذاشته شود.


پردازش تصویر اولیه و استخراج
متن CAPP

در باره

ما نمی توانستیم حداقل چند کلمه ای در مورد نویسنده ابزار TesserCAP فوق العاده بگویم. نام او Gurs'ev Singh Calra است. این کار به عنوان مشاور اصلی در بخش خدمات حرفه ای Foundstone، که در McAfee گنجانده شده است، کار می کند. Gursyev در چنین کنفرانس هایی به عنوان TOORCON، NULCON و CLUBHACK انجام شد. او نویسنده ابزار Tessercap و SSLSMART است. علاوه بر این، چندین ابزار را برای نیازهای داخلی شرکت توسعه داد. زبان های برنامه نویسی مورد علاقه - روبی، روبی بر روی ریل ها و C #. بخش خدمات حرفه ای FoundStone® Professional که در آن کار می کند، خدمات متخصص و آموزش سازمانها را ارائه می دهد، حفاظت دائمی و موثر دارایی های خود را از جدی ترین تهدیدات تضمین می کند. تیم بخش خدمات حرفه ای شامل کارشناسان شناخته شده در زمینه امنیت و توسعه دهندگان است که دارای تجربه غنی از همکاری با شرکت های بین المللی و دولت هستند

رابط. برگه اصلی

پس از شروع برنامه، پنجره ای با سه زبانه ظاهر می شود: اصلی، گزینه ها، پیش پردازش تصویر. تب اصلی شامل کنترل هایی است که برای شروع و توقف تست تصویر CAPTCHA استفاده می شود، شکل گیری آمار آزمون (چقدر سپرده شده است، و چند نفر)، حرکت و تصویر را برای پیش پردازش انتخاب کنید. در فیلد ورودی URL (کنترل شماره 1)، آدرس دقیق باید مشخص شود که برنامه وب برای استخراج CAPP استفاده می شود. URL را می توان به صورت زیر به دست آورد: روی سمت راست CAPTCHA-IMAGE کلیک کنید، کد صفحه را کپی یا مشاهده کنید و URL را از ویژگی SRC از برچسب تصویر حذف کنید. سایت / Common / RateIt / Captcha.asp؟ در نزدیکی رشته آدرس یک عنصر است که از تعداد کلاه هایی که برای تست دانلود می شود، می پرسد. از آنجا که برنامه می تواند به طور همزمان تنها 12 عکس را نشان دهد، عناصر کنترل برای تقلب صفحه را فراهم می کند. بنابراین، با آزمایش بزرگ در مقیاس، ما قادر به حرکت از طریق کلاه های بارگذاری شده و مشاهده نتایج به رسمیت شناختن آنها. دکمه ها شروع و توقف شروع و متوقف می شوند. پس از آزمایش، شما باید نتایج تشخیص تصویر را تخمین بزنید، هر کدام از آنها را به صورت صحیح یا نادرست ذکر کنید. خوب، دومی، مهمترین تابع برای انتقال هر تصویر به سیستم پیش پردازش استفاده می شود که در آن فیلتر مشخص شده است که نویز و اعوجاج را از تصویر حذف می کند. برای انتقال تصویر به سیستم پیش پردازش، شما باید بر روی تصویر دلخواه با دکمه سمت راست ماوس کلیک کنید و SPET را به PREPROCESSOR PREPROCESSOR ارسال کنید.

رابط. برگه گزینه ها

برگه گزینه شامل کنترل های مختلف برای پیکربندی TesserCAP است. در اینجا شما می توانید یک سیستم OCR را انتخاب کنید، تنظیمات پروکسی وب را تنظیم کنید، تصاویر حمل و نقل و پیش پردازش را روشن کنید، هدر های سفارشی HTTP را اضافه کنید، و همچنین طیف وسیعی از کاراکترهای سیستم تشخیص را مشخص کنید: اعداد، حروف در حروف کوچک، حروف حروف بزرگ، شخصیت های خاص.

در حال حاضر در مورد هر گزینه در جزئیات بیشتر. اول از همه، شما می توانید سیستم OCR را انتخاب کنید. به طور پیش فرض، تنها یک موجود است - Tesseract-Orc، بنابراین شما مجبور نیستید با انتخاب انتخاب کنید. خیلی زیاد یک فرصت جالب برنامه ها - طیف وسیعی از کاراکترها را انتخاب کنید. به عنوان مثال، CAPTCHA از سایت - می توان دید که این شامل هیچ حرفی نیست، اما تنها از اعداد تشکیل شده است. پس چرا ما به شخصیت های اضافی نیاز داریم که تنها احتمال تشخیص نادرست را افزایش می دهد؟ اما اگر شما انتخاب کنید؟ آیا برنامه می تواند یک بسته را تشخیص دهد حروف بزرگ هر زبانی؟ نه نمی توانم. این برنامه لیستی از کاراکترهای مورد استفاده برای تشخیص را می گیرد، از فایل های پیکربندیواقع در \\ برنامه های برنامه \\ Foundstone Free Tools \\ Tessercap 1.0 \\ tessdata \\ configs. من در مثال توضیح خواهم داد: اگر پیام های عددی و گزینه های کوچک را انتخاب کنیم، برنامه با فایل lowernumeric با شروع از پارامتر Tesdit تماس می گیرد چارلیست سفید این یک لیست از کاراکترهایی است که برای حل CAPP استفاده می شود. به طور پیش فرض، فایل ها تنها حروف الفبا لاتین را شامل می شوند، بنابراین لازم است که لیستی از کاراکترها را برای تشخیص سیریلیک جایگزین یا اضافه کنید.

در حال حاضر کمی در مورد آنچه شما به فیلد هدایای درخواست HTTP نیاز دارید. به عنوان مثال، در برخی از وب سایت ها باید وارد سیستم شوید تا بتوانید CAPTCHA را ببینید. برای استفاده از TesserCAP برای دسترسی به KAP، برنامه باید در درخواست های HTTP از این سرفصل ها به عنوان قبول، کوکی و ارجاع و غیره ارسال شود. با استفاده از پروکسی وب (Fiddler، Burp، Charles، Webscarab، Paros، و غیره)، شما می توانید کلاهبرداری های پرس و جو ارسال شده را بردارید و آنها را در فیلد ورودی هدایای HTTP درخواست کنید. گزینه دیگری که احتمالا مفید است، تغییر مسیر را دنبال کنید. واقعیت این است که tessercap پیش فرض نباید هدایت شود. اگر URL تست باید تصویر را برای به دست آوردن یک تصویر دنبال کنید، باید این گزینه را انتخاب کنید.

خوب، آخرین گزینه باقی مانده بود، که شامل / جدا کردن مکانیسم پیش پردازش، که ما به آن نگاه خواهیم کرد. به طور پیش فرض، تصاویر قبل از پردازش غیر فعال است. کاربران ابتدا پیش فرض از پیش تعیین شده تصویر را با توجه به تصاویر CAPTCHA تست کرده و سپس این ماژول را فعال کنید. تمام تصاویر CAPTCHA پس از تعویض در گزینه Preprocessing Image Enable، پیش پردازش را دریافت کرده و قبلا به سیستم Tesseract OCR منتقل می شوند تا متن را استخراج کنند.

رابط. زبانه پیش پردازش تصویر

خوب، ما به برگه جالب تر رسیدیم. در اینجا این است که فیلترها پیکربندی شده اند تا سر و صدا و تاری را حذف کنند، که تلاش می کنند تا کار سیستم تشخیص را تا حد امکان پیچیده تر کنند. فرآیند راه اندازی یک فیلتر جهانی بسیار ساده است و شامل نه مرحله است. در هر مرحله از پیش پردازش، نمایش داده می شود. علاوه بر این، صفحه دارای جزء بازرسی است که به شما اجازه می دهد تا صحت را با یک فیلتر پسوند تخمین بزنید. جزئیات هر مرحله را در نظر بگیرید.

مرحله 1. تغییر رنگ

در این مرحله، رنگ پیکسل ها برای تصاویر CAPTCHA معکوس می شوند. کد زیر نشان می دهد که چگونه این اتفاق می افتد:

برای (هر پیکسل در captcha) (اگر (invertred درست است) جدید قرمز \u003d 255 - قرمز فعلی اگر (invertblue درست است) جدید آبی \u003d 255 - آبی فعلی اگر (invertGreen درست است) جدید سبز \u003d 255 - سبز فعلی)

Inversion از یک یا چند رنگ اغلب ویژگی های جدید را برای بررسی تست Chaptcha تست می کند.

مرحله 2. تغییر رنگ

در این مرحله، شما می توانید اجزای رنگ را برای تمام پیکسل های تصویر تغییر دهید. هر فیلد عددی ممکن است حاوی 257 (از 1 تا 255) باشد. برای اجزای RGB هر پیکسل، بسته به مقدار، مراحل زیر در این زمینه انجام می شود:

  1. اگر مقدار -1 باشد، جزء رنگ مربوطه تغییر نمی کند.
  2. اگر مقدار برابر با -1 نیست، تمام اجزاء یافت نشد رنگ مشخص شده (قرمز، سبز یا آبی) تغییر مطابق با مقدار وارد شده در این زمینه تغییر دهید. مقدار 0 جزء را حذف می کند، مقدار 255 حداکثر شدت آن و غیره را تعیین می کند.

مرحله 3. درجه بندی خاکستری (مقیاس روشنایی)

در مرحله سوم، تمام تصاویر به تصاویر در نمرات سیاه و سفید تبدیل می شوند. این تنها گام اجباری تبدیل تصاویری است که نمی توانند از دست رفته باشند. بسته به دکمه انتخاب شده، یکی از اقدامات زیر مرتبط با مولفه رنگ هر پیکسل انجام می شود:

  1. متوسط \u200b\u200b-\u003e (قرمز + سبز + آبی) / 3.
  2. انسان -\u003e (0.21 * قرمز + 0.71 * سبز + 0.07 * آبی).
  3. به طور متوسط \u200b\u200bحداقل و حداکثر اجزای رنگ -\u003e (حداقل (قرمز + سبز + آبی) + حداکثر (قرمز + سبز + آبی)) / 2.
  4. حداقل -\u003e حداقل (قرمز + سبز + آبی).
  5. حداکثر -\u003e حداکثر (قرمز + سبز + آبی).

بسته به شدت و توزیع کامپوننت رنگ CAPTCHA، هر یک از این فیلترها می تواند تصویر قابل استخراج را برای پردازش بیشتر بهبود بخشد.


مرحله 4. صاف کردن و شدت

برای جلوگیری از استخراج متن از تصاویر CAPTCHA، آنها نویز را به صورت نقاط تک صحنه یا چند جانبه، خطوط خارجی و اعوجاج فضایی اضافه می کنند. هنگام صاف کردن تصویر، نویز تصادفی افزایش می یابد، برای از بین بردن که فیلترهای سطل یا برش استفاده می شود. در قسمت عددی، گذر باید مشخص شود چند بار نیاز به استفاده از ماسک تصویر مناسب قبل از رفتن به مرحله بعدی. بیایید به اجزای فیلتر برای صاف کردن و افزایش وضوح نگاه کنیم. دو نوع ماسک تصویر در دسترس هستند:

  1. ماسک های ثابت به طور پیش فرض، TesserCAP شش ماسک محبوب ترین تصویر دارد. این ماسک ها می توانند تصویر را صاف کنند یا تیز را افزایش دهند (تبدیل لاپلاس). تغییرات بلافاصله پس از انتخاب ماسک با استفاده از دکمه های مناسب نمایش داده می شود.
  2. ماسک های سفارشی کاربر همچنین می تواند ماسک های پردازش تصویر سفارشی را با وارد کردن مقادیر به زمینه های عددی پیکربندی کند و دکمه Save Mask را فشار دهید. اگر مجموع ضرایب در این پنجره ها کمتر از صفر باشد، یک خطا صادر می شود و ماسک اعمال نمی شود. هنگام انتخاب یک ماسک ثابت، دکمه ذخیره ماسک مورد نیاز نیست.

مرحله 5. سایه های خاکستری را معرفی کنید

در این مرحله از پردازش تصویر، پیکسل های آن را می توان در طیف گسترده ای از سایه های خاکستری رنگ کرد. این فیلتر توزیع نماز های خاکستری را در 20 Bakencakes (سطل) / محدوده ها نشان می دهد. درصد پیکسل های رنگی در سایه های خاکستری در محدوده 0 تا 12 در Baken (سطل) ذکر شده است 0، درصد پیکسل های رنگی در سایه های خاکستری در محدوده 13 تا 25 - در Bokket (سطل) 1 ، و غیره. کاربر می تواند یکی از مراحل زیر را برای هر محدوده مقادیر مربوط به سایه های خاکستری انتخاب کند:

  1. به حال خودش بگزارید.
  2. سفید (سفید) را جایگزین کنید.
  3. جایگزین سیاه

با تشکر از این گزینه ها، شما می توانید محدوده های مختلف سایه های خاکستری را کنترل کنید، و همچنین با تغییر سایه های خاکستری به سمت سفید یا سیاه، سر و صدا را برش / حذف کنید.

مرحله 6. تنظیم برش (Cutoff)

این فیلتر یک نمودار از مقدار خاکستری را از فرکانس وقوع ایجاد می کند و پیشنهادات را برای انتخاب کلیپ ارائه می دهد. اصل عملیات فیلتر برش در زیر pseudocode نشان داده شده است:

اگر (مقدار سیاه و سفید پیکسل<= Cutoff) pixel grayscale value = (0 OR 255) -> بسته به کدام گزینه انتخاب شده است (<= или => : تنظیم پیکسل EVE با ارزش<=/=> آستانه به 0. باقی مانده به 255)

این نمودار نشان می دهد توزیع دقیق پیکسل های CAPTCHA در رنگ ها و کمک به حذف تداخل با برش مقادیر سطح خاکستری.

مرحله 7: Tripping (خرد کردن)

پس از استفاده از صاف کردن، قطع، سطل و دیگر فیلترهای CAPTCHA، هنوز هم می تواند توسط نقاط تک صحنه یا چند جانبه، بیگانگان و اعوجاج های فضایی شل شود. اصل بهره برداری از فیلتر برش به شرح زیر است: اگر تعداد پیکسل های مجاور نقاشی شده در این سایه خاکستری، کمتر از اندازه در میدان عددی، فیلتر مجرای آنها را به مقدار 0 (سیاه و سفید) یا 255 (سفید) اختصاص می دهد با انتخاب یک کاربر در این مورد، CAPTCHA هر دو در جهت افقی و عمودی تجزیه و تحلیل می شود.

مرحله 8: تغییر عرض مرز

به گفته نویسنده ابزار، در طول تحقیقات اولیه و توسعه TesserCAP، بارها و بارها اشاره کرده است که هنگامی که تصاویر CAPTCHA دارای خط مرزی ضخیم است و رنگ آن از پس زمینه اصلی CAPTCHA متفاوت است، برخی از سیستم های OCR نمی توانند متن را تشخیص دهند. این فیلتر برای پردازش خطوط مرزی و تغییرات آنها طراحی شده است. خطوط مرزی با عرضی که در فیلد عددی ذکر شده است، توسط انتخاب کاربر در سیاه و سفید رنگ شده است.

مرحله 9: معکوس سایه خاکستری

این فیلتر هر پیکسل را می گذراند و مقدار آن سطح خاکستری جدید را جایگزین می کند، همانطور که در زیر pseudocode نشان داده شده است. Inversion of Gray انجام می شود تا تصویر را تحت تنظیمات رنگ سیستم OCR قرار دهد.

برای (هر پیکسل در CAPTCHA) مقدار جدید خاکستری جدید \u003d 255 - ارزش سیاه و سفید فعلی

مرحله 10: بررسی تشخیص ضبط

هدف از این مرحله انتقال تصویر CAPTCHA قبلا پردازش شده از سیستم OCR برای تشخیص است. دکمه حل شده تصویر را پس از یک فیلتر معکوس خاکستری به سیستم OCR می فرستد تا متن را استخراج کند و متن بازگشتی را نمایش دهد رابط گرافیکی. اگر متن شناخته شده با متن بر روی یک پین هماهنگ باشد، ما به درستی فیلتر را برای پیش پردازش تنظیم می کنیم. حالا شما می توانید به برگه گزینه بروید و گزینه پیش پردازش را برای پردازش تمام کلاه های بارگذاری شده بعدی فعال کنید.

شناسایی Capps

خوب، شاید ما به تمام گزینه های این ابزار نگاه کردیم، و در حال حاضر خوب است که هر گونه محدود کردن قدرت را آزمایش کنیم ..


نتیجه تجزیه و تحلیل سایت جمع آوری با مقدماتی
پردازش تصویر. با توجه به نتایج، فیلتر کردن
ایمان شکست خورد

بنابراین، ابزار را راه اندازی کنید و به سایت مجله بروید. لیست را می بینیم اخبار تازه، به اولین چیزی که سقوط کرد بروید و به جایی بروید که می توانید نظر خود را ترک کنید. بله، نظر بسیار آسان است برای اضافه کردن (هنوز هم، اما برای مدت طولانی همه در حال حاضر در حال حاضر خواب) - شما باید وارد یک پین شوید. خوب، بررسی کنید که آیا ممکن است آن را خودکار کنید. URL تصویر را کپی کنید و آن را در رشته آدرس TesserCAP قرار دهید. ما مشخص می کنیم که شما نیاز به بارگذاری 12 در هر کلاهک دارید و روی شروع کلیک کنید. این برنامه به طور مطلوب 12 عکس را بارگیری کرد و سعی کرد آنها را تشخیص دهد. متأسفانه، تمام کاپ ها به رسمیت شناخته نشده اند، همانطور که توسط کتیبه نشان داده شده است -F.Failed- تحت آنها، یا به رسمیت شناخته نشده است. به طور کلی، تعجب آور نیست، از آن زمان احضار خارجی و اعوجاج حذف نشد. این در حال حاضر ما با آن برخورد خواهیم کرد. روی یکی از 12 عکس دانلود شده کلیک راست کلیک کنید و آن را به سیستم پیش پردازش ارسال کنید (ارسال به پیش پردازنده تصویر). به دقت بررسی شده تمام 12 در هر کلاه، ما می بینیم که آنها فقط شامل اعداد، بنابراین ما به برگه گزینه ها می رویم و مشخص می کنیم که تنها اعداد باید تشخیص دهند (مجموعه کاراکتر \u003d عددی). اکنون می توانید به برگه پیش پردازش تصویر بروید تا فیلترها را تنظیم کنید. بلافاصله می گویم که بازی با سه فیلترهای اول ("تغییر رنگ"، "تغییر رنگ"، "Grayscale") بازی کرد، هیچ اثر مثبتی را نمی بینم، بنابراین من به طور پیش فرض همه چیز را ترک کردم. من ماسک صاف 2 ماسک را انتخاب کردم و تعداد پاساژ های برابر با یک را تنظیم کردم. سطل های سیاه و سفید فیلتر من از دست رفته و بلافاصله به تنظیمات قطع شد. من ارزش 154 را انتخاب کردم و نشان دادم که این پیکسل هایی که کمتر مورد نیاز است باید در 0 تنظیم شوند و کسانی که بیشتر در 255 سالگی قرار می گیرند. برای خلاص شدن از نقاط باقی مانده، تبدیل به خرد کردن و تغییر عرض مرز به 10. آخرین فیلتر شامل معنی نیست، بنابراین من بلافاصله بر روی حل فشار آوردم.

در پین، من شماره 714945 داشتم، اما این برنامه آن را به عنوان 711435 به رسمیت شناخت. این، همانطور که می بینید، کاملا نادرست است. در نهایت، همانطور که می دانستم، به طور معمول کار نمی کردم. من مجبور شدم با pastebin.com آزمایش کنم، که قادر به تشخیص بدون هیچ مشکلی بود. اما اگر شما خود و بیمار را روشن کنید و شما می توانید تشخیص صحیح کمپین را از سایت دریافت کنید، پس بلافاصله به برگه گزینه ها بروید و پیش پردازش تصاویر را فعال کنید (پیش پردازش تصویر را فعال کنید). سپس به صفحه اصلی بروید و با کلیک بر روی شروع، یک بخش تازه از CAPP را بارگذاری کنید، که اکنون فیلتر شما پیش پردازش شده است. پس از کار برنامه، چک کردن به درستی / نادرست به رسمیت شناخته شده را بررسی کنید (علامت گذاری به عنوان صحیح / علامت به عنوان دکمه های نادرست). از حالا به بعد، می توانید با استفاده از آمار نشان می دهد به آمار تشخیص تلفیقی نگاه کنید. به طور کلی، این یک گزارش عجیب و غریب در مورد امنیت یکپارچه خاص است. اگر یک سوال در مورد انتخاب یک راه حل یا یک راه حل دیگر وجود داشته باشد، پس با کمک TesserCAP ممکن است آزمایش خود را صرف کنید.

نتیجه تایید CAPTCHA در سایت های محبوب

وب سایت و اشتراک گذاری صلیب به اشتراک گذاشته شده:

  • ویکی پدیا\u003e 20-30٪
  • eBay\u003e 20-30٪
  • reddit.com\u003e 20-30٪
  • CNBC\u003e 50٪
  • foodnetwork.com\u003e 80-90٪
  • dailymail.co.uk\u003e 30٪
  • megaupload.com\u003e 80٪
  • pastebin.com\u003e 70-80٪
  • cavenue.com\u003e 80٪

نتیجه

تصاویر CAPTCHA یکی از موثر ترین مکانیسم های حفاظت از برنامه های کاربردی وب از پر کردن خودکار فرم ها است. با این حال، کلاه های ضعیف قادر به محافظت در برابر روبات های تصادفی خواهند بود و قبل از تلاش های هدفمند برای حل آنها ایستاده اند. مانند الگوریتم های رمزنگاری، تصاویر CAPTCHA، با دقت آزمایش شده و اطمینان از سطح بالایی از امنیت، بیشتر هستند بهترین راه حفاظت. بر اساس آمارهایی که نویسنده برنامه ذکر شده بود، Recaptcha را برای پروژه های من انتخاب کردم و من آن را به تمام دوستانم توصیه خواهم کرد - معلوم شد که مقاوم ترین از آزمایش شده است. در هر صورت، نباید فراموش کنید که خدمات بسیاری وجود دارد که یک راه حل نیمه اتوماتیک CAPTCHA ارائه می دهند. از طریق یک API خاص، تصویر را به سرویس منتقل می کنید، و یک راه حل را در یک زمان کوتاه می گذارد. تصمیم می گیرد یک فرد مجذور (به عنوان مثال از چین)، پنی خود را برای آن بگیرد. در اینجا هیچ حفاظتی وجود ندارد. 🙂