OCR CuneiForm გადაღებული ან დასკანირებული ტექსტის სრული ამოცნობისთვის. საუკეთესო ტექსტის ამოცნობის პროგრამები

მთავარი / მობილური მოწყობილობები

როგორც კი ადამიანმა გამოიგონა კომპიუტერი, მან დაიწყო მასში ცოდნის გადაცემა. ვინაიდან ცოდნის მთავარი მატარებელი მოსვლამდე კომპიუტერული ტექნიკაიყო წიგნები, გაჩნდა პრობლემა - როგორ შეიძლება დაგროვილი ინფორმაცია სწრაფად გადაიზარდოს „ციფრულში“? სისულელე იქნებოდა ამისთვის გამოვიყენოთ წიგნების ციფრულ ფორმატში გადაყვანის უმარტივესი და აშკარა გზა - ხელით აკრეფა. კაცობრიობა ათასობით წლის განმავლობაში აგროვებდა სხვადასხვა ტექსტებს, ამიტომ მათი ხელახლა „დაწერის“ პროცესი წარმოუდგენლად დიდ დროს დასჭირდებოდა. ამ პრობლემის გადასაჭრელად საჭირო იყო რამდენიმე მარტივი და ეფექტური გზატექსტის ხელახალი აკრეფის პროცესის ავტომატიზაცია. ასე გაჩნდა სხვადასხვა ოპტიკური სიმბოლოების ამოცნობის ტექნოლოგიები, ან მოკლედ OCR (optical character recognition). დღესდღეობით ყველა სტუდენტი და სკოლის მოსწავლე იცნობს საბეჭდი ფურცლის ტექსტურ დოკუმენტად გადაქცევის პროცედურას. დაბეჭდილი ტექსტი სკანირებულია (ან ფოტოგრაფია), შემდეგ სპეციალური გამოყენებით პროგრამული უზრუნველყოფაკომპიუტერი აანალიზებს ტექსტის სურათს და ხაზს უსვამს მას სურათზე ინდივიდუალური ელემენტებიდა ქმნის ახალ დოკუმენტს, რომელშიც შეყვანილია ყველა აღიარებული ასო და სიმბოლო. ასეთი დოკუმენტი ჩვეულებრივ რედაქტირებადია, ასე რომ თქვენ შეგიძლიათ შეასწოროთ მანქანის ამოცნობის შეცდომები და იმუშაოთ მასთან, როგორც აკრეფილი ტექსტით. საწყისი ტექსტის სირთულისა და დასკანირებული სურათის ხარისხზე დამოკიდებულია OCR აპლიკაციით დოკუმენტის დამუშავების პროცესს მეტ-ნაკლებად დრო სჭირდება. საბედნიეროდ, დღეს აკრეფილი ტექსტის ფორმატში გადაყვანის პროცედურაა ელექტრონული დოკუმენტიგაცილებით ნაკლები დრო სჭირდება, ვიდრე რამდენიმე წლის წინ - კომპიუტერული ტექნიკის შესაძლებლობები საგრძნობლად გაიზარდა ბოლო ათი წლის განმავლობაში და გამოსახულების ანალიზის ალგორითმების მუდმივი გაუმჯობესების წყალობით, შეცდომის მაჩვენებელი გაცილებით დაბალია. უფრო მეტიც, ახლა ტექსტის ამოცნობა შეიძლება ენდობა ონლაინ სერვისებსაც კი, რომელთა უპირატესობები ჩვეულებრივი დესკტოპის აპლიკაციებთან შედარებით აშკარაა - არ არის საჭირო ძვირადღირებული პროგრამული უზრუნველყოფის დახარჯვა და აპლიკაციის ინსტალაციის დროს დროის დაკარგვა. დაბოლოს, ონლაინ ამოცნობის ხელსაწყოების გამოყენებით, შეგიძლიათ მიიღოთ რედაქტირებადი ტექსტი სურათიდან თუნდაც კომპიუტერებზე, სადაც უბრალოდ არ არსებობს პროგრამების დაყენების საშუალება, მაგალითად, ბიბლიოთეკის საჯარო კომპიუტერზე.

⇡ FineReader ონლაინ

დავიწყოთ ABBYY-ის ონლაინ სერვისით. გასაკვირი არ არის, რომ ის იყენებს პოპულარულ FineReader პროგრამას ტექსტის ამოცნობის სისტემად. ამ პროდუქტს არ სჭირდება რეკლამა - დღეს ეს აპლიკაცია შეიძლება ჩაითვალოს ერთ-ერთ საუკეთესო OCR ვარიანტად.

ამ პროგრამის წარმატებული პოპულარიზაციის მრავალი მიზეზი არსებობს. უპირველეს ყოვლისა, ეს არის გაპრიალებული ალგორითმი დაბეჭდილი სიმბოლოების იდენტიფიცირებისთვის. ყველაზე პოპულარული ოპტიკური ტექსტის ამოცნობის სისტემის FineReader-ის ძრავა წლების განმავლობაში გაუმჯობესდა, ხოლო გამოსახულების ანალიზის ძრავა გაუმჯობესდა ვერსიიდან ვერსიამდე. პროგრამაში განხორციელდა სხვადასხვა ცვლილებები და გაუმჯობესება, რამაც შეამცირა ამოუცნობი ან არასწორად იდენტიფიცირებული სიმბოლოების რაოდენობა სკანირებული სურათის დამუშავებისას. FineReader მოიცავს ბევრ ხელსაწყოს და დამხმარე ხელსაწყოს, რაც შესაძლებელს ხდის შესრულებას ჯარიმა დაყენებაპროგრამები, გააუმჯობესოს ორიგინალური გამოსახულების ხარისხი, განსაზღვროს გასაცნობი სიმბოლოების ტიპი, დააყენოს დამუშავების სფეროები და ა.შ. ონლაინ სერვისი არის უფასო პროექტი, რომელიც მომხმარებლებს საშუალებას აძლევს შეაფასონ FineReader-ის სიზუსტე. მისი ერთ-ერთი მთავარი უპირატესობაა განსაზღვრული ენების დიდი რაოდენობის მხარდაჭერა (სულ ხელმისაწვდომია 37 ენა). სერვისით სარგებლობისთვის უნდა დარეგისტრირდეთ. ვინაიდან ეს პროექტი ნაწილობრივ სარეკლამო ხასიათს ატარებს, მისი ტექსტის ამოცნობის შესაძლებლობები მნიშვნელოვნად შეზღუდულია. პირველ რიგში, სურათის ანალიზი ხდება სრულად ავტომატურ რეჟიმში. მომხმარებელს შეუძლია მიუთითოს მხოლოდ ამოცნობის ენა და ჩართოს ოფცია, რომელიც საშუალებას მოგცემთ მიიღოთ ამოცნობის შედეგის ბმული შეყვანილ ელფოსტის მისამართზე. მეორეც, სერვერზე ატვირთული ფაილის ზომა არ უნდა აღემატებოდეს 10 მეგაბაიტს. მაგრამ ყველაზე უსიამოვნო შეზღუდვა არ არის დიდი რაოდენობადოკუმენტები, რომელთა ამოცნობა შესაძლებელია. ერთის ქვეშ გადის ანგარიში, შეგიძლიათ არაუმეტეს ათი ფაილის დამუშავება. თუმცა, დამეთანხმებით, რომ ეს ცუდი არ არის. FineReader Online-ს ასევე შეუძლია მხარდაჭერილი ენების ნებისმიერი კომბინაციის შემცველი ტექსტების დამუშავება. ამასთან, სერვისი არ გაძლევთ საშუალებას აირჩიოთ ერთი დოკუმენტისთვის სამზე მეტი ამოცნობის ენა. დეველოპერები ამას მოტივირებენ იმით, რომ მსგავსი ფუნქციამნიშვნელოვნად შეანელებს ტექსტის ამოცნობის პროცესს. დასრულებული ტექსტის ამოცნობის შედეგი შეიძლება შეინახოს ერთ-ერთ ფორმატში - MS Word (.doc), MS Excel (.xls), PDF, PDF/A, RTF და TXT. პრინციპში, სერვისი უმკლავდება დავალებას და ამოიცნობს ტექსტს. თუმცა, სამართლიანობისთვის, უნდა ითქვას, რომ თუნდაც ძალიან კარგი ხარისხისორიგინალური სურათი არ იძლევა აღიარების 100% გარანტიას. ისეთი „იდეალური“ სურათიც კი, როგორიცაა სერვისის გვერდზე ინსტრუმენტების მინიშნების ეკრანის ანაბეჭდი, FineReader Online-მა შეცდომით ამოიცნო.

⇡ ახლავე!

ახლავე! არის ბრიტანული სერვისი, რომელიც ასევე იყენებს FineReader-ს, როგორც ტექსტის ამოცნობის სისტემას. უკვე რეგისტრაციის ეტაპზე შეგიძლიათ აირჩიოთ ფორმატი, რომელშიც მონაცემები შეინახება ნაგულისხმევად - RTF, PDF, XLS, XLM, TXT ან ვებ არქივი. თქვენ შეგიძლიათ შეცვალოთ ფორმატი ყოველ ჯერზე, როდესაც ატვირთავთ ახალ ფაილს. გარდა ამისა, შესაძლებელია ტექსტის ფოსტით მიღება. აღსანიშნავია, რომ შედეგები შეიძლება შეფუთული იყოს ZIP არქივში, რაც შეამცირებს შედეგად მიღებული ფაილის ჩამოტვირთვის დროს. სერვისი მხარს უჭერს სურათების ჩამოტვირთვას TIF, PNG და JPG (JPEG) ფორმატებში, ასევე PDF. გარდა ამისა, თქვენ შეგიძლიათ ატვირთოთ ZIP არქივები, რომლებიც შეიცავს მხარდაჭერილი ფაილის ტიპებს, და ისინი ავტომატურად გაიხსნება და დამუშავდება. ZIP არქივი მოსახერხებელია არა მხოლოდ იმიტომ, რომ საშუალებას გაძლევთ შეამციროთ ფაილების ზომა, რომლებიც უნდა აიტვირთოთ სერვერზე, არამედ იმიტომ, რომ საშუალებას გაძლევთ ატვირთოთ რამდენიმე ფაილი ერთდროულად.

OcrNow! მუშაობს თექვსმეტ ენაზე, მათ შორის დოკუმენტები რუსულ, ინგლისურ, ფრანგულ, ჩეხურ, ესპანურ, იტალიურ ენებზე. ენა არჩეულია ფაილის ჩამოტვირთვისას. მაშინაც კი, თუ ენას არ მიუთითებთ, სერვისი შეეცდება მის ამოცნობას ავტომატურად, თუმცა, შესაძლებელია შეცდომა დაუშვას, ამიტომ მაინც ჯობია ენა ხელით შეარჩიოთ. აღსანიშნავია, რომ თქვენ შეგიძლიათ აირჩიოთ მხოლოდ ერთი ენა. თითოეული დარეგისტრირებული მომხმარებელი იღებს ორ უფასო კრედიტს, რომლითაც შესაძლებელია ორი A4 გვერდის ამოცნობა. თუ თქვენ გჭირდებათ მუშაობა მეტი მონაცემებით, თქვენ უნდა იყიდოთ კრედიტები. მათი ღირებულება დამოკიდებულია იმაზე, თუ რამდენი კრედიტის შეძენას გადაწყვეტთ ერთდროულად. მაგალითად, თუ ყიდულობთ 20 კრედიტს, მაშინ ერთი A4 ფურცლის ამოცნობა ეღირება 0,1 ფუნტი სტერლინგი (დაახლოებით 4,6 რუბლი), ხოლო თუ ერთდროულად იყიდით 500 კრედიტს, მაშინ ერთი ფურცლის ამოცნობის ღირებულება დაეცემა დაახლოებით 2,96 რუბლამდე. სერვისის შემქმნელები გვთავაზობენ სპეციალურ პროგრამას, რომელიც საშუალებას გაძლევთ გამოიყენოთ იგი ერთად Apple iPhone. ამ პროგრამის გამოყენებით შეგიძლიათ გადაიღოთ დოკუმენტები, შემდეგ კი გაგზავნოთ სამსახურში და მიიღოთ შედეგები. უფასო ვერსიაეს პროგრამა საშუალებას გაძლევთ დაამუშავოთ ათი ფოტო, ხოლო კომერციული ვერსია, რომელიც ამ შეზღუდვას მოხსნის, 14 დოლარი ეღირება.

მომხმარებლები, რომლებიც ხშირად წვდებიან სერვისს მათიდან დესკტოპ კომპიუტერი, მიზანშეწონილია ჩამოტვირთოთ Unimessage Solo პროგრამა, რომელიც შექმნილია ფაილების სკანირებისთვის. ამ პროგრამის თავისებურება ის არის, რომ ის ინტეგრირდება ocrNow-თან! გარდა ამისა, მისი დახმარებით შექმნილი ფაილები შეიძლება აიტვირთოს Facebook-ზე.

⇡ OnlineOCR.ru

ეს სერვისი არის კომერციული. მასთან მუშაობისთვის საჭიროა კრედიტების შეძენა, თითოეული კრედიტი არის დოკუმენტის ერთი გვერდის ამოცნობის შესაძლებლობა. თუმცა, დემო რეჟიმშიც კი, მისი გამოყენება შესაძლებელია ტექსტის მცირე ფრაგმენტების თარგმნისთვის. სერვისი გთავაზობთ ფაილების ძალიან მოსახერხებელ ატვირთვას - შეგიძლიათ ერთდროულად ატვირთოთ რამდენიმე სურათი სერვერზე, შეფუთოთ ისინი ZIP არქივში. ფაილის მაქსიმალური ზომაა 20 მეგაბაიტი, მაგრამ უფრო დიდი ფაილების გამოყენება შესაძლებელია, მაგრამ ამ შესაძლებლობის მისაღებად უნდა დაუკავშირდეთ სერვისის ადმინისტრაციას. როგორც წყაროს ფორმატი გრაფიკული ფაილიშეგიძლიათ გამოიყენოთ TIFF (მრავალგვერდიანი დოკუმენტების ჩათვლით), JPEG/JPG, BMP, PCX, PNG, GIF, PDF.

თუ იყენებთ ამ სერვისისთუ მრავალგვერდიანი დოკუმენტი აღიარებულია, მაგალითად, PDF, შეგიძლიათ მიუთითოთ მხოლოდ ცალკეული გვერდები ამოცნობისთვის. ამისათვის ამოცნობის პარამეტრებში უნდა მონიშნოთ ველი "მრავალგვერდიანი დოკუმენტის" საპირისპიროდ და გვერდის დიაპაზონის ველში მიუთითოთ მძიმით გამოყოფილი საჭირო გვერდები (ან დეფისით გამოყოფილი გვერდების დიაპაზონი). თუ მიუთითებთ, ვთქვათ, "4.13", სერვისი ამოიცნობს მხოლოდ მეოთხე და მეცამეტე გვერდებს. დემო რეჟიმში, OnlineOCR.ru სერვისი არ ცნობს მთელ ტექსტს, მაგრამ მხოლოდ მის ნაწილს. მთლიანობაში, სერვისი მხარს უჭერს 28 ენას, მათ შორის რუსულ, ინგლისურ, ბელორუსულ, უნგრულ, ჰოლანდიურ, ბერძნულ, დანიური, ესპანური, ლატვიური, ლათინური, გერმანული, პოლონური, შვედური, ფინური, ფრანგული, უკრაინული და ა.შ. სერვისი საშუალებას გაძლევთ შეინახოთ ამომცნობი ფაილები მიიღება ვირტუალურ ონლაინ ოფისში, დაარედაქტირეთ, გაგზავნეთ ფოსტით და დაბეჭდეთ.

⇡NewOCR.com

NewOCR.com პროექტი არ საჭიროებს რეგისტრაციას ან დამატებით ფულად ხარჯებს მომხმარებლის მხრიდან. სერვისს აქვს მინიმალისტური ინტერფეისი და მისი პარამეტრები ენის არჩევაზე მოდის. თუ ჩატვირთულ სურათს აქვს არასწორი ორიენტაცია, მაგალითად, სკანირების დროს ის 90 გრადუსით შემოტრიალდა, შეგიძლიათ დააყენოთ გამოსახულების ბრუნვის კუთხე სერვისის ჩამოსაშლელ მენიუში. გრაფიკული ფაილის დამუშავების ხარისხი სასურველს ტოვებს - საბოლოო დოკუმენტი შეიცავს უამრავ ამოცნობის შეცდომას, ამიტომ ძნელად ღირს ამ სერვისის გამოყენება დიდი რაოდენობის გვერდების დასამუშავებლად. ეს ნაკლი გარკვეულწილად შერბილებულია იმით, რომ პროექტი მხარს უჭერს მუშაობას 29 ენაზე (რუსულის ჩათვლით).

თქვენ შეგიძლიათ ამოიცნოთ სურათები JPEG ფორმატები, PNG, GIF, BMP და მრავალგვერდიანი TIFF ფაილები. ფაილის ზომა არ უნდა აღემატებოდეს ხუთ მეგაბაიტს, ხოლო მრავალგვერდიანი PDF დოკუმენტებისთვის ლიმიტი არის 20 მეგაბაიტი. დასკანირებული სურათის დამუშავების შემდეგ, სერვისი აჩვენებს შედეგს ცალკე ველში, ატვირთული სურათის ასლის გვერდით. აღიარებული ტექსტის ექსპორტირება შესაძლებელია .doc ან .txt ფორმატში.

⇡ Free-OCR.com

ამ სერვისის გამოყენება უფასოა და რეგისტრაცია არ არის საჭირო. სპამისგან დასაცავად, გამოიყენება საკონტროლო სურათი (Captcha). თუმცა, ამ სერვისის არჩევისას თქვენი ფაილების დასამუშავებლად, უნდა გაითვალისწინოთ შეზღუდვები, რომლებიც ვრცელდება დამუშავებულ სურათებზე. ამრიგად, სერვერზე ატვირთული ფაილების ზომა შემოიფარგლება ორი მეგაბაიტით. სერვისის კიდევ ერთი შეზღუდვა, რომელიც ეხება გადმოწერილ ფაილებს, არის ის, რომ თითოეული გრაფიკული გამოსახულების გარჩევადობა არ უნდა აღემატებოდეს 5000 პიქსელს სიგანეში. გარდა ამისა, Free-OCR.com ადგენს ლიმიტს დამუშავებული დოკუმენტების რაოდენობაზე. თქვენ შეგიძლიათ ატვირთოთ არაუმეტეს ათი სურათი საათში.

ჩართულია მომენტშისერვისი ვერ ცნობს მრავალგვერდიან PDF ან TIFF დოკუმენტებს, ამიტომ ასეთი ფაილების დამუშავებისას მხოლოდ პირველი გვერდი ამოიცნობა. სერვისი საშუალებას გაძლევთ დაამუშავოთ გვერდები ტექსტის მრავალი სვეტით. Free-OCR.com-ის პარამეტრებში თქვენ არ შეგიძლიათ აირჩიოთ ერთზე მეტი ენა, ასე რომ, თუ ცდილობთ ამოიცნოთ, მაგალითად, რუსული ტექსტი ინგლისური ტერმინებით, ბევრი შეცდომა იქნება. მხარდაჭერილი ენების საერთო რაოდენობა, რომლებიც შეიძლება ამოირჩიოთ აღიარებისთვის, საკმაოდ დიდია - ოცდაცხრა, რუსულის ჩათვლით. დოკუმენტის ამოცნობის ხარისხი დამაკმაყოფილებელია.

⇡ დასკვნა

ყველა ონლაინ ტექსტის ამოცნობის სერვისი არ არის გათვალისწინებული უფასოდ. თუმცა, ფასი, რომელსაც მათი შემქმნელები ითხოვენ, შესამჩნევად დაბალია, ვიდრე სპეციალიზებული პროგრამული უზრუნველყოფის ღირებულება. ბუნებრივია, თუ ყოველდღიურად გჭირდებათ ათობით დოკუმენტის ამოცნობა, მაშინ ონლაინ სერვისის შემქმნელებისთვის გადახდა ნაკლებად სავარაუდოა თქვენთვის - ბევრად იაფი იქნება პროგრამის ლიცენზიისთვის ერთხელ გადახდა. მაგრამ თუ ასეთ ინსტრუმენტებს მხოლოდ დროდადრო იყენებთ, მაშინ უფრო ადვილია გადაიხადოთ გვერდების საჭირო რაოდენობის ამოცნობისთვის ან შეეცადოთ გაუმკლავდეთ სრულიად უფასო სერვისებს.

22

გადათარგმნის თუ არა OCR პროგრამა სურათს, მაგალითად, მნიშვნელობების სიაში?

უფრო დეტალურად დავალება შემდეგია:

ჩვენ გვაქვს კლიენტის აპლიკაცია, რომელშიც მომხმარებელს შეუძლია ანგარიშის გახსნა. ეს ანგარიში შეიცავს მნიშვნელობების ცხრილს. მაგრამ ყველა ანგარიში ერთნაირად არ გამოიყურება - განსხვავებული შრიფტები, განსხვავებული ინტერვალი, განსხვავებული ფერები, შესაძლოა ანგარიში შეიცავს ბევრ ცხრილს მწკრივების/სვეტების სხვადასხვა რაოდენობით...

მომხმარებელი ირჩევს მოხსენების ზონას, რომელიც შეიცავს მაუსის გამოყენების ცხრილს.

ახლა ჩვენ გვინდა გადავიტანოთ არჩეული ცხრილი მნიშვნელობებად - ჩვენი OCR ინსტრუმენტის გამოყენებით.

იმ დროს, როდესაც მომხმარებელი ირჩევს მართკუთხა ზონას, შემიძლია მოვითხოვო დამატებითი ინფორმაციადასახმარებლად OCR პროცესში და მოითხოვეთ დადასტურება, რომ მნიშვნელობები სწორად იქნა აღიარებული.

თავდაპირველად ეს იქნება ექსპერიმენტული პროექტი და, შესაბამისად, დიდი ალბათობით OpenSource OCR ხელსაწყოთი - ან თუნდაც ისეთი, რომელიც არ ჯდება ფული ექსპერიმენტული მიზნებისთვის.

  • 7 პასუხი
  • დახარისხება:

    აქტივობა

18

მარტივი პასუხი არის დიახ, თქვენ უბრალოდ უნდა აირჩიოთ სწორი ინსტრუმენტები.

არ ვიცი ღიაა თუ არა წყარო კოდიმიაღწიეთ 100%-მდე სიზუსტეს ამ სურათებზე, მაგრამ აქ პასუხებიდან გამომდინარე, ალბათ დიახ, თუ გარკვეული დრო დაუთმოთ ცხრილის გარჩევის პრობლემის სწავლასა და გადაჭრას და ა.შ.

როდესაც ვსაუბრობთ კომერციულ OCR-ზე, როგორიცაა ABBYY ან სხვა, ის მოგცემთ 99%+ სიზუსტეს და ავტომატურად ამოიცნობს ცხრილებს. არავითარი ტრენინგი, არაფერი, მხოლოდ მინუსი არის ის, რომ თქვენ უნდა გადაიხადოთ $$ ამაში. ზოგიერთი ამტკიცებს, რომ ღია კოდისთვის თქვენ იხდით თქვენს დროს მის დასაყენებლად და წვლილისთვის, მაგრამ აქ თქვენ გადაწყვიტეთ.

თუმცა, თუ ჩვენ ვსაუბრობთ კომერციულ ინსტრუმენტებზე, სინამდვილეში არჩევანი არსებობს. და ეს დამოკიდებულია იმაზე, თუ რა გსურთ. Boxed პროდუქტები, როგორიცაა FineReader, რეალურად ფოკუსირებულია შეყვანის დოკუმენტების რედაქტირებად დოკუმენტებად გადაქცევაზე, როგორიცაა Word ან Excell. იმიტომ რომ რეალურად გსურთ მონაცემების მიღება და არა Word დოკუმენტი, შეიძლება დაგჭირდეთ სხვა პროდუქტის კატეგორიაში მოძიება - მონაცემთა გადაღება, რომელიც არსებითად არის OCR და დამატებითი ლოგიკა გვერდზე საჭირო მონაცემების მოსაძებნად. ინვოისის შემთხვევაში, ეს შეიძლება იყოს კომპანიის სახელი, მთლიანი თანხა, გადახდის ვადა, მაგიდის ნივთები და ა.შ.

მონაცემთა აღრიცხვა რთულია და მოითხოვს გარკვეულ მომზადებას, მაგრამ სწორად გამოყენებისას შეიძლება უზრუნველყოს გარანტირებული სიზუსტე დოკუმენტებიდან მონაცემების აღებისას. ის იყენებს განსხვავებულ წესებს მონაცემთა ჯვარედინი დამოწმებისთვის, მონაცემთა ბაზების ძიებისთვის და ა.შ. საჭიროების შემთხვევაში მას შეუძლია მონაცემების ხელით გადამოწმებისთვის. საწარმოები ფართოდ იყენებენ Data Capture აპლიკაციებს ყოველთვიურად მილიონობით დოკუმენტის გადასაღებად და დიდწილად ეყრდნობიან მათ ყოველდღიურ სამუშაო ნაკადში მოპოვებულ მონაცემებს.

ასევე არის OCR SDK, რომელიც მოგცემთ წვდომას API-ზე OCR შედეგებისთვის, რათა დაპროგრამოთ რა უნდა გააკეთოთ მონაცემებთან.

თუ უფრო დეტალურად აღწერთ თქვენს დავალებას, შემიძლია მოგაწოდოთ რჩევები, თუ რომელი მიმართულებით უფრო ადვილია წასვლა.

განახლება

ასე რომ, რასაც თქვენ აკეთებთ, ძირითადად მონაცემთა შეგროვების აპია, მაგრამ არა სრულად ავტომატიზირებული, იყენებს იმას, რასაც "დაწკაპეთ ინდექსზე" მიდგომას იყენებს. ბაზარზე ბევრი აპლიკაციაა, სადაც ხედავთ სურათებს და ოპერატორი აწკაპუნებს სურათზე მოცემულ ტექსტზე (ან ხაზავს მის გარშემო ველებს) და შემდეგ ავსებს ველებს მონაცემთა ბაზაში. ეს კარგი მიდგომაა, როდესაც დასამუშავებელი სურათების რაოდენობა შედარებით მცირეა და ხელით დატვირთვა არ არის საკმარისად დიდი, რომ გაამართლოს სრულად ავტომატიზირებული აპლიკაციის ღირებულება (დიახ, არის სრულად ავტომატიზირებული ავტომატური სისტემები, რომელსაც შეუძლია სურათების დამზადება სხვადასხვა შრიფტით, ინტერვალით, განლაგებით, ცხრილების ხაზების რაოდენობით და ა.შ.).

თუ გადაწყვეტთ მასალის შემუშავებას და მისი შეძენის ნაცვლად, თქვენ მხოლოდ უნდა აირჩიოთ OCR SDK. ყველა მომხმარებლის ინტერფეისი, რომლის დაწერასაც თავად აპირებ, არა? დიდი არჩევანი - გადაწყვიტე: ღია წყარო ან კომერციული.

საუკეთესო ღია წყარო არის Tesseract OCR რამდენადაც ვიცი. ეს უფასოა, მაგრამ შეიძლება ჰქონდეს რეალური პრობლემები ცხრილის გაანალიზებასთან დაკავშირებით, მაგრამ ხელით ზონირებით ეს არ უნდა იყოს პრობლემა. რაც შეეხება OCR სიზუსტეს - ადამიანები ხშირად ასწავლიან OCR-ს შრიფტს სიზუსტის გასაუმჯობესებლად, მაგრამ ეს არ უნდა იყოს თქვენთვის, რადგან შრიფტები შეიძლება განსხვავდებოდეს. ასე რომ, შეგიძლიათ უბრალოდ სცადოთ tesseract და ნახოთ რა სახის სიზუსტეს მიიღებთ - ეს გავლენას მოახდენს რაოდენობაზე თვითნაკეთიამის გამოსწორება.

კომერციული OCR მოგცემთ უფრო მაღალ სიზუსტეს, მაგრამ დაგიჯდებათ ფული. ვფიქრობ, მაინც უნდა ნახოთ, ღირს თუ არა, თუ ტესერაკი საკმარისია თქვენთვის. ყველაზე მეტად ეს მგონია მარტივი გზითეს იქნებოდა იტვირთება საცდელი ვერსიაზოგიერთი OCR პროდუქტის ფანჯარა, მაგალითად FineReader. თქვენ მიხვდებით, რა სიზუსტე იქნება OCR SDK-ში.

5

რა OCR-ზეა საუბარი?
შეიმუშავებთ კოდებს ამ OCR-ზე დაფუძნებული თუ გამოიყენებთ რამეს თაროებიდან?

მას აქვს დანერგილი შესრულებადი დოკუმენტის წამკითხველი, ასე რომ თქვენ შეგიძლიათ შეიყვანოთ მასში მთელი გვერდი და ის ამოიღებს სიმბოლოებს თქვენთვის. ის საკმაოდ კარგად ცნობს სივრცეებს, მას შეუძლია დაეხმაროს ჩანართების დაშორებაში.

0

გამარჯობა გარი, დიახ, მე უკვე დავიწყე Tesseract-ის ყურება, მაგრამ პირველი რამდენიმე ექსპერიმენტის შემდეგ, არ გამიმართლა. მაგალითად ბიტმაპირომელიც გამოვგზავნე კითხვით, მივიღებ შედეგს" ცარიელი გვერდი" მაგრამ იქნებ უბრალოდ მჭირდება სწორი პარამეტრების მითითება? - გარეტ ოუენი 30 მაისი. 11 2011-05-30 07:39:55

1

მე ვიყენებ OCR-ს ჩემი კვლევისთვის უკვე რამდენიმე წელია. მე თითქმის არასდროს ვიღებ ცარიელ გვერდს, თუ არ მივაწოდებ. თუმცა, ზოგჯერ მე მათ ვიღებ იმიტომ, რომ 1) @tesseract-ის ბინერიზაცია ფილტრავს ღირებული ინფორმაციის უმეტესობას 2) კარგი ბინერიზაციის შემდეგაც კი, სიმბოლოები ვერ ამოიცნობს, რადგან ა) სიმბოლოებს შორის მანძილი ძალიან მცირეა (სიმბოლოები ძალიან მჭიდროდ არის შეფუთული). ბ) პერსონაჟები არ არის ის, რასაც ტესერაკი ასწავლიდა 2a-სთვის, სცადეთ სურათის გაფართოება ორიგინალური გამოსახულების 400%%-ით? ამით გამიმართლა! - გარი ცუი 30 მაისი. 11 2011-05-30 07:44:43

0

+1: თეთრი ხაზები მოვაშორე ჩემგან ტესტის სურათი, გაიზარდა 400%-ით და შემდეგ Tesseract-მა გააკეთა მნიშვნელობების მეორე სვეტის 100%-ით ზუსტი ამოცნობა (პირველი მნიშვნელობა იგნორირებულია). პერსპექტიულად გამოიყურება, მაგრამ კიდევ ექსპერიმენტების გაკეთება მჭირდება. - გარეტ ოუენი 30 მაისი. 11 2011-05-30 08:15:41

3

ეს ნამდვილად დამოკიდებულია განხორციელებაზე.

არსებობს რამდენიმე პარამეტრი, რომელიც გავლენას ახდენს OCR-ის ამოცნობის უნარზე:
1. რამდენად კარგად არის მომზადებული OCR - მაგალითის მონაცემთა ბაზის ზომა და ხარისხი
2. რამდენად კარგად არის გაწვრთნილი „ნაგვის“ აღმოსაჩენად (ასევე, იმის ცოდნა, თუ რა არის ასო, უნდა იცოდე, რა არის ასო).
3. დიზაინი და OCR ტიპი
4. თუ ეს არის ნერვული ქსელი, ნერვული ქსელის სტრუქტურა გავლენას ახდენს მის სწავლისა და „გადაჭრის“ უნარზე.

ასე რომ, თუ თქვენ არ გააკეთებთ საკუთარ თავს, ეს მხოლოდ სხვადასხვა ტიპის ტესტირების საკითხია, სანამ არ იპოვით შესაფერისი.

15

თუ ყოველთვის გაქვთ მყარი საზღვრები თქვენს მაგიდაზე, შეგიძლიათ სცადოთ ეს გამოსავალი:

წინააღმდეგ შემთხვევაში, დოკუმენტი ცხრილის ველების გარეშეა, შეგიძლიათ სცადოთ მიჰყვეთ ამ ხაზს:

OCR საკმაოდ საოცარი რამ არის, მაგრამ ის ყოველთვის არ არის სრულყოფილი. საუკეთესო შედეგის მისაღებად, შეგიძლიათ გამოიყენოთ ყველაზე სუფთა შეყვანა. ჩემს თავდაპირველ ექსპერიმენტებში აღმოვაჩინე, რომ მთელ დოკუმენტზე OCR-ის შესრულება საკმაოდ კარგად მუშაობდა, როგორც უჯრედის საზღვრების ამოღებისას (გრძელი ჰორიზონტალური და ვერტიკალური ხაზები). თუმცა, პროგრამამ შეკუმშა ყველა სივრცე ცარიელ სივრცეში. მას შემდეგ, რაც ჩემს შეყვანის დოკუმენტებს ჰქონდათ რამდენიმე სვეტი, რომელშიც რამდენიმე სიტყვა იყო თითოეულ სვეტში, უჯრედების საზღვრები იკარგებოდა. უჯრედებს შორის ურთიერთობის შენარჩუნება ძალიან მნიშვნელოვანი იყო, ამიტომ ერთ-ერთი შესაძლო გადაწყვეტილებებიიყო თითოეული უჯრედის საზღვრებზე უნიკალური სიმბოლოს დახატვა, როგორიცაა "^" - რასაც OCR მაინც ამოიცნობს და რომელიც მოგვიანებით გამოვიყენებდი მიღებული რიგების გამოსაყოფად,

მთელი ეს ინფორმაცია ამ ბმულზე ვიპოვე Google-ის თხოვნით „OCR to table“. ავტორმა გამოაქვეყნა სრული ალგორითმი Python-ისა და Tesseract-ის გამოყენებით, ორივე ღია კოდის გადაწყვეტილებით!

თუ გსურთ სცადოთ Tesseract-ის ძალა, იქნებ სცადოთ ეს საიტი:

ჩვენ ასევე ვიბრძოდით ცხრილებში OCR საკითხებთან. არსებობს ორი გამოსავალი, რომელიც ამას აკეთებს, ABBYY Recognition Server და ABBYY FlexiCapture. Rec Server არის მაღალი მოცულობის, სერვერის მხარეს OCR ინსტრუმენტი, რომელიც შექმნილია დოკუმენტების დიდი მოცულობის საძიებო ფორმატში გადასაყვანად. მიუხედავად იმისა, რომ ის ხელმისაწვდომია API-ით ამ გამოყენებისთვის, ჩვენ გირჩევთ FlexiCapture-ს. FlexiCapture უზრუნველყოფს დაბალი დონის კონტროლს ცხრილის ფორმატებიდან მონაცემების ამოღებაზე, მათ შორის ცხრილის ელემენტების ავტომატურ ამოცნობას გვერდზე. ის ხელმისაწვდომია API სრულ ვერსიაში წინა ნაწილის გარეშე ან ოფშორულ ვერსიაში, რომელსაც ჩვენ ვყიდით. დამიკავშირდით, თუ გსურთ მეტი იცოდეთ.

3

მე ვიყენებ OCR-ს სკანირებულ დოკუმენტებს 98 წლიდან.

დიახ, არსებობს რამდენიმე კარგი კომერციული სისტემა და ზოგიერთ მათგანს შეუძლია უზრუნველყოს, ერთხელ კარგად დარეგულირებული, მონაცემთა გასაოცარი სიხშირე, ხოლო მხოლოდ ოპერატორის დახმარებას მოითხოვს იმ ძალიან დეგრადირებული ველებისთვის. შენ რომ ვიყო, ზოგიერთ მათგანს დავეყრდნობოდი.

თუ კომერციული არჩევანი საფრთხეს უქმნის თქვენს ბიუჯეტს, OSS-ს შეუძლია ხელი შეუწყოს. მაგრამ "უფასო სადილი არ არის." ასე რომ, თქვენ მოგიწევთ დაეყრდნოთ სპეციალურად შემუშავებულ სკრიპტებს ხელმისაწვდომი გადაწყვეტათქვენი დოკუმენტაციის დასამუშავებლად. საბედნიეროდ, თქვენ მარტო არ ხართ. სინამდვილეში, ბევრმა ადამიანმა განიცადა ეს ბოლო ათწლეულების განმავლობაში. ასე რომ, IMHO, ამ კითხვაზე საუკეთესო და მოკლე პასუხი არ არის მოცემული ამ სტატიაში:

საკმაოდ ხშირად ჩნდება გრაფიკული ფაილების სახით წარმოდგენილ ტექსტთან მუშაობის აუცილებლობა. იქნება ეს სურათი, დასკანირებული დოკუმენტი თუ ფოტოასლი, მათში შემავალი ინფორმაციის ხელით აკრეფას შეიძლება საკმაოდ დიდი დრო დასჭირდეს.

პროგრამის მიმოხილვა

ამ მიზნით არსებობს უამრავი პროგრამა. მათთან მუშაობის დასაწყებად საკმარისია გქონდეთ სურათი ან დასკანირებული დოკუმენტი, რომელიც უნდა გადაკეთდეს ტექსტად. მათი უმეტესობა მსგავსია მათი ფუნქციებით, მაგრამ ამავე დროს მათ აქვთ უნიკალური ინსტრუმენტები, რომლებიც შესაფერისია კონკრეტული მიზნებისთვის.

როგორ არ დაიკარგოთ მათ მრავალფეროვნებაში და რომელ მათგანზე ღირს ყურადღების მიქცევა? ამას შემდეგში განვიხილავთ.

CuneiForm

პირველი პროგრამა, რომელზეც ჩვენ ყურადღებას გავამახვილებთ არის CuneiForm. ეს არის უფასო პროგრამა Cognitive Technologies-ისგან. მისი მთავარი მიზანია ელექტრონული ასლების ან სურათების სახით წარმოდგენილი ტექსტების ოპტიკური ამოცნობა. ის სწრაფად გარდაქმნის გრაფიკულ ფაილს ტექსტად, რომლითაც შეგიძლიათ მუშაობა ნებისმიერ საოფისე აპლიკაციაში.


პროგრამის ძირითადი მახასიათებლები:

F reemore OCR

Freemore OCR მსგავსია თავისი ფუნქციებით. ეს არის მარტივი და თავისუფლად ხელმისაწვდომი პროგრამა, რომელიც შეიძლება გამოყენებულ იქნას სურათებიდან ტექსტის ამოსაღებად სხვადასხვა ფორმატში და PDF დოკუმენტებში. სკანირების დასრულების შემდეგ, შედეგი შეიძლება შეინახოს ფაილში, რომელიც შეიძლება გაიხსნას Notepad-ით ან Word-ით.


Freemore OCR არის: მიაქციე ყურადღება! ასეთი განაცხადების მუშაობა საბუთებით ქ PDF ფორმატში წყარო მასალა.

FreeOCR

FreeOCR არის კიდევ ერთი მოსახერხებელი OCR აპლიკაცია.მას აქვს ინტუიციური ინტერფეისი და შეიცავს ამისთვის საჭირო ყველა ხელსაწყოს კომპლექტს. აღსანიშნავია, რომ პროგრამის მენიუ ჩართულია ინგლისური, მაგრამ მისი დიზაინისადმი უჩვეულო მიდგომის წყალობით, ის გასაგებია ყველა მომხმარებლისთვის. პროგრამა მხარს უჭერს მუშაობას სხვადასხვა სურათებთან სხვადასხვა ფორმატში და PDF ფაილებთან.

FreeOCR მახასიათებლები:

  1. სურათების ყველა პოპულარულ ფორმატში გადაკეთების შესაძლებლობა;
  2. სტანდარტული მენიუს ნაკლებობა, რომლის ნაცვლად მომხმარებელს სთავაზობენ სასურველ მოქმედების ამსახველ დიდ ხატებს;
  3. მინიმალისტური ინტერფეისი, რომელიც შეიცავს მხოლოდ ძირითადს;
  4. მრავალი ენის, მათ შორის რუსულის აღიარების მხარდაჭერა;
  5. დაბალი სისტემური მოთხოვნები.

მნიშვნელოვანი! FreeOCR-ის დასაყენებლად, თქვენ უნდა იყოთ დაკავშირებული ინტერნეტთან. პროგრამის გაშვების შემდეგ ის ავტომატურად განაახლებს მონაცემთა ბაზას და ჩამოტვირთავს გამოტოვებულ ლექსიკონებს ონლაინ საცავიდან. გაშვებისას, თუ ის აღმოაჩენს უცნობ სიმბოლოებს ან ენას, FreeOCR-მა შეიძლება ასევე შესთავაზოს განახლება.

ვიდეო: ტექსტის ამოცნობა სურათიდან

SimpleOCR

SimpleOCR არის მსგავსი პროგრამა ტექსტის ამოცნობისთვის სკანირების შემდეგ.შესანიშნავია მასთან მუშაობისთვის უცხო ენები, რადგან მას აქვს დიდი და მუდმივად გაუმჯობესებული ლექსიკა. გარდა ამისა სტანდარტული ნაკრებიფუნქციებს, აქვს სიტყვის ან კომბინაციის მოძებნის შესაძლებლობა მიღებულ ტექსტში და გაფართოებული ფორმატირების ვარიანტები. კარგად შეეფერება დიდი ტექსტების დამუშავებას.

SimpleOCR-ის გამორჩეული მახასიათებლები:


RiDoc

RiDoc არის აპლიკაცია, რომლის მთავარი ფუნქციაა დოკუმენტების სკანირებულ ასლებთან მუშაობა და მათი უბრალო ტექსტად გადაქცევა.

ყველაფერი მზად არის სკანირებისთვის - უბრალოდ დააკავშირეთ პრინტერი და დაიწყეთ მუშაობა, რის შემდეგაც პროგრამა დაიწყებს შერჩეული ფაილების დამუშავებას.

  1. გარდა ამისა, ის საშუალებას გაძლევთ შეამციროთ დოკუმენტის ზომა წყაროს მასალის ხარისხის დაკარგვის გარეშე. RiDoc ფუნქციები:
  2. პრინტერებთან მუშაობის ხელსაწყოების დიდი ნაკრები, ყველაზე პოპულარული მოდელების მხარდაჭერა;
  3. რამდენიმე დოკუმენტის ერთ ფაილში გაერთიანების, მათი რედაქტირებისა და მოწყობის შესაძლებლობა;
  4. გალერეის შექმნა, რომელშიც ყველა მიღებული შედეგი ინახება;
  5. ექსპორტი MS Word, PDF და გრაფიკულ ფაილებში; შედეგის გაგზავნაელ
  6. პირდაპირ აპლიკაციის ინტერფეისიდან;
  7. ჭვირნიშნების შექმნა, რომელიც იცავს შედეგს;

სიჩქარე და მოხერხებულობა.

img2txt img2txt –, რომელიც გარდაქმნის სხვადასხვა ტიპის გრაფიკულ ფაილებს ტექსტურ მასალად.პროგრამა მხარს უჭერს ყველაზე ცნობილ ფორმატებს, მარტივი გამოსაყენებელია და თავისუფლად არის ხელმისაწვდომი.

ძირითადი ფუნქციები და მახასიათებლები:

  1. სხვადასხვა ფორმატის სურათების ტექსტურ ფაილებად გადაქცევა;
  2. დოკუმენტების სკანირებისა და ტექსტის ფრაგმენტების სურათებში ამოცნობა;
  3. უკიდურესად მარტივი მენიუ, რომელიც შეიცავს ინსტრუმენტების საკმარის კომპლექტს;
  4. შედეგის შენახვა სხვადასხვა ფორმატში;
  5. უფასო განაწილება.

მიაქციე ყურადღება! img2txt, ისევე როგორც სხვა მსგავსი აპლიკაციები, აქვს საკუთარი ონლაინ ვერსია, რომლის განვითარებასა და გაუმჯობესებაზეც ახლა ყურადღებას ამახვილებენ მისი შემქმნელები.

SunnyPage

SunnyPage არის მოსახერხებელი პროგრამა, რომელიც საშუალებას გაძლევთ ჩამოტვირთოთ და დააკონვერტიროთ სხვადასხვა ტიპის სურათები, იქნება ეს დოკუმენტის სკანირებული ასლი, სურათი თუ ფოტო კარგი ხარისხით.

ის ასევე მხარს უჭერს PDF დოკუმენტებთან მუშაობას. პროგრამა მოიცავს ვრცელ ლექსიკონს და ენის ავტომატური ამოცნობის ფუნქციას.

  1. გარდა ამისა, SunnyPage:
  2. მხარს უჭერს დამატებითი ლექსიკონების ჩამოტვირთვას და ახალი სიტყვებისა და ფრაზების ხელით დამატებას;
  3. მუშაობს დიდი მოცულობით, მათი ერთ ფაილში შენახვის შესაძლებლობით; აქვს ფუნქციების ნაკრები გამოსახულების რედაქტირებისთვის,ავტომატური პარამეტრები
  4. მათი სიკაშკაშე და დეფექტების მოხსნა;
  5. "კითხულობს" ყველაზე ცნობილ ფორმატებს;
  6. საშუალებას გაძლევთ შეინახოთ შედეგი Word ფაილში;

აქვს მრავალენოვანი ინტერფეისი.

Abbyy Finereader სკანირებისა და ტექსტის ამოცნობის პროგრამა ABBYY FineReader დამსახურებულად არის საუკეთესო ტექსტის ამოცნობის პროგრამა.

მისი პოპულარობა განპირობებულია ყველა საჭირო ფუნქციის არსებობით, რომელსაც მომხმარებელი ეძებს ასეთ აპლიკაციებში. ის სრულად თავსებადია Microsoft Office-თან, რომელიც საშუალებას გაძლევთ დაიწყოთ დოკუმენტთან მუშაობა კონვერტაციის პროცესის დასრულებისთანავე.


რისი გაკეთება შეუძლია ABBYY FineReader-ს?

Capture2Text Capture2Text არის პორტატული აპლიკაცია, რომელსაც აქვს ფუნქციების ფართო სპექტრი დოკუმენტებთან მუშაობისთვის. მისიგამორჩეული თვისება

არის სკრინშოტის ან მისი ნაწილის გადაღების და გამოსახულების სახით შენახვის შესაძლებლობა. ამის შემდეგ შეგიძლიათ დაიწყოთ მუშაობა, მიღებული ინფორმაციის გადატანა დოკუმენტში ტრადიციულ ფორმატში.

Capture2Text არ საჭიროებს ინსტალაციას და მისი გაშვება შესაძლებელია ფლეშ დრაივიდან. ეს ხდის მას გამოყენებადს მრავალ სფეროში და უბრალოდ შეუცვლელს მათთვის, ვისაც ყოველთვის სჭირდება მარტივი და ძლიერი გადამყვანი ხელთ.

  • სურათების (სურათები, სკანირება, ფოტოასლები) სტანდარტული კონვერტაცია Word დოკუმენტებად;
  • მეტყველების ამოცნობა (რუსულის ჩათვლით) და ხმის აკრეფა;
  • ცხელი კლავიშების მინიჭების შესაძლებლობა;
  • ტექსტის აღება დესკტოპიდან ან მისი ნაწილიდან და შემდგომი დამუშავება.

Google Docs

ყველა ზემოაღნიშნული კომუნალური პროგრამის გარდა, ტექსტის ფრაგმენტების ოპტიკური ამოცნობის ფუნქცია წარმოდგენილია Google Docs-ში. ეს სერვისი მხარს უჭერს ფაილებთან JPG, PNG და GIF ფორმატებში მუშაობას, ასევე მრავალგვერდიან PDF დოკუმენტებს. წყარო შეიძლება იყოს სკანერების გამოყენებით მიღებული სურათები, ასევე ჩვეულებრივი ფოტოები.

აღსანიშნავია, რომ ამ სერვისის გამოყენებისას ორიგინალური ფორმატირება ყოველთვის არ არის დაცული. ზოგიერთი სტრუქტურა, როგორიცაა სიები, სვეტები და სქოლიოები, შეიძლება დაიკარგოს.

ამაზე დიდ გავლენას ახდენს გადმოწერილი გრაფიკული ფაილის ხარისხი. მიღებული დოკუმენტების შენახვა შესაძლებელია სერვისზე Google Drive, შემდეგ ჩამოტვირთეთ თქვენს კომპიუტერში ან გაიგზავნა ელექტრონული ფოსტით.

თითოეულ განხილულ პროგრამას აქვს საკმარისი ინსტრუმენტები თავისი თავდაპირველი მიზნის შესასრულებლად - ფაილების კონვერტაციისთვის სხვადასხვა ფორმატშიტექსტური დოკუმენტები. თუმცა, ისინი განსხვავდებიან თავიანთ კომპლექტში დამატებითი ფუნქციები, ინტერფეისი და მხარდაჭერილი ენები. სამუშაოდ, თქვენ უნდა აირჩიოთ აპლიკაცია (ან რამდენიმე), რომელიც აკმაყოფილებს თქვენს მოთხოვნებს და შეუძლია ყველაზე ზუსტად გაუმკლავდეს ამოცანას.

>

ქაღალდი, როგორც ინფორმაციის მთავარი მატარებელი, თანდათან კარგავს თავის მნიშვნელობას. ქაღალდის დოკუმენტების ნაცვლად, თუ ეს შესაძლებელია, გამოიყენეთ მათი ელექტრონული ვერსია. მაგრამ როგორ გადავიტანოთ არსებული არქივები ელექტრონულ ფორმაში? ამ პრობლემის გადასაჭრელად ისინი შეიქმნა სპეციალური პროგრამებიტექსტის ამოცნობისთვის.

რა არის OCR პროგრამები და როგორ მუშაობს ისინი?

ეს პროგრამული პროდუქტები იყენებს ORC (ოპტიკური სიმბოლოების ამოცნობა) ან ICR (Intelligence character recognition) ტექნოლოგიას. ეს აბრევიატურები ითარგმნება რუსულად, როგორც "ოპტიკური" ან "ინტელექტუალური პერსონაჟების ამოცნობა".

პროგრამები OCR-ის გამოყენებით მუშაობს შემდეგნაირად. სკანერიდან მიღებული ტექსტით ფოტო დაყოფილია მრავალ ფრაგმენტად. თითოეული მათგანისთვის აპლიკაცია ქმნის რამდენიმე ვარაუდს. მათი შემოწმებით და სტანდარტებთან შედარებით, თითოეულ ფრაგმენტს ენიჭება დამთხვევის ხარისხის შესაბამისი ქულა. მათგან ყველაზე დიდის არჩევით, პროგრამა „ხედავს“ სიმბოლოს და აჩვენებს მას ჩაშენებული ტექსტური რედაქტორის ველში.

IRC მუშაობს იმავე პრინციპით, მაგრამ იყენებს ხელოვნურს ნერვული ქსელები. ამ მეთოდის მთავარი უპირატესობა არის პროგრამების კომპაქტურობა და უწყვეტი სწავლა. ეს საშუალებას გაძლევთ ეფექტურად ამოიცნოთ პირის მიერ ხელნაწერი ასოებით დაწერილი სიტყვები. მაგრამ ამ ტექნოლოგიას არ შეუძლია მყარი ხელნაწერი ტექსტის „წაკითხვა“.

თითოეული არსებულისთვის ოპერაციული სისტემებიჩვენ შევიმუშავეთ ჩვენი საკუთარი OCR პროგრამები. Windows OS-ში მუშაობისთვის ყველაზე პოპულარულია:

  • ABBYY FineReader;
  • OmniPage;
  • რედირისი;
  • Samsung Scan OCR პროგრამა;

კომპიუტერის პროგრამების გარდა, ხელმისაწვდომია მრავალი ონლაინ ტექსტის ამოცნობის სერვისი. მათ შორის ყველაზე ცნობილია FineReader Online, OnlineOCR, FreeOCR.

ABBYY FineReader 14

ეს პროგრამული პროდუქტი შეიქმნა ადგილობრივი კომპანიის ABBYY-ის მიერ და არის ერთ-ერთი საუკეთესო პროგრამებს შორის, რომლებიც იყენებენ OCR-ს. პროგრამა ეფუძნება ორიგინალურ ძრავას სახელწოდებით Finereader Engine. ის უზრუნველყოფს შემდეგ მახასიათებლებს:

  • დაბეჭდილი ტექსტის სწრაფი ამოცნობა 98%-ზე მეტი სიზუსტით. იმუნიტეტი ორიგინალური სურათის ხარისხზე. ეს იგივე საშუალებას იძლევა სკანერის ან კამერის გამოყენებით გადაღებულ ფოტოებზე.
  • ADRT ტექნოლოგია საშუალებას გაძლევთ ამოიცნოთ არა მხოლოდ ტექსტი, არამედ მისი ფორმატირება: შრიფტი, აბზაცები, აბზაცები, სვეტები.
  • Multithreading შესაძლებლობა ეს გაძლევთ საშუალებას გამოიყენოთ ყველა პროცესორის ბირთვი (მაქსიმუმ 4) ამოცნობის პროცესის დასაჩქარებლად.
  • მხარს უჭერს 190-ზე მეტ ენას, მათ შორის მათ, ვინც იყენებს ლათინური ან კირილიცის გარდა სხვა ანბანს (იაპონური, ჩინური, არაბული).
  • ჩაშენებული ტექსტური რედაქტორი საშუალებას გაძლევთ შეამოწმოთ ამოცნობის შედეგი ან შეცვალოთ იგი.
  • ურთიერთქმედება საოფისე პაკეტი. ეს საშუალებას გაძლევთ ექსპორტის აღიარებული ტექსტი Microsoft Wordდა Excel შემდგომი დამუშავებისთვის.
  • სასწავლო პროგრამის შესაძლებლობა. ეს ფუნქცია საშუალებას გაძლევთ ავარჯიშოთ პროგრამა ასოების კონკრეტული სტილის „წაკითხვაზე“. მაგალითად, მორგებული შრიფტი ან ხელნაწერი ბლოკის ასოები.
  • PDF-თან მუშაობა. FineReader საშუალებას გაძლევთ ამოიცნოთ ტექსტი ამ ტიპის ფაილიდან და დააკავშიროთ მრავალი დასკანირებული სურათი PDF ან PDF/A-ში.

ამ პროგრამის მთავარი მინუსი არის ფასი. მუდმივი ლიცენზია ძირითადი ვერსიაეღირება 7 ათასი რუბლი. ვერსიები "ბიზნესი" და "საწარმო" - 12 და 39 ათასი რუბლი, შესაბამისად. თუ გეგმავთ პროგრამის გამოყენებას მხოლოდ სახლში, მაშინ შეგიძლიათ ჩამოტვირთოთ პროდუქტის გატეხილი მე-11 ან მე-12 ვერსია ტორენტ ტრეკერიდან.

სისტემის მოთხოვნები:

  • პროცესორი: 32-ბიტიანი ან 64-ბიტიანი, 1 გჰც-ზე მეტი SSE 2 ინსტრუქციების ნაკრების მხარდაჭერით (. Intel Celeron M და უკეთესი, AMD Athlon 64 და უკეთესი).
  • ოპერატიული მეხსიერება: 1 GB. თუ პროცესორს აქვს 1-ზე მეტი ბირთვი, მაშინ თითოეულს დამატებით სჭირდება 512 მბ.
  • მყარი დისკი: 3 GB - ინსტალაციისა და ექსპლუატაციისთვის.
  • სკანერი: მხარს უჭერს TWAIN და WIA დრაივერებს.
  • ოპერაციული სისტემა: Windows 7,8,8.1,10.

მომხმარებლის მოსაზრებები FineReader 14-ის შესახებ

ისინი დადებითად საუბრობენ FineReader-ზე და ხაზს უსვამენ პროდუქტის უნარს ამოიცნოს ტექსტი ცუდი ქაღალდის ორიგინალებიდან, მოსახერხებელი და მარტივი ინტერფეისი და მაღალი სიჩქარეგამოსახულების დამუშავება.

იმ პრობლემებს შორის, რომლებიც წარმოიქმნება ამ OCR პროგრამის გამოყენებისას, ზოგიერთი მომხმარებელი აღნიშნავს, რომ გამოსახულების მენეჯერი სწორად არ მუშაობს. მაგალითად: დასკანერებული სურათის სიკაშკაშის არაადეკვატური რეგულირება.

ყველა გვერდი 18

FineReader-ის მთავარი კონკურენტი რუსული ბაზარი ORC პროგრამები. ფუნქციონალური თვალსაზრისით, ის ძალიან ჰგავს მოწინააღმდეგეს, მაგრამ აქვს რამდენიმე განსხვავება:

  • სკანირებისა და ამოცნობის პროცესის დაწყების შესაძლებლობა სკანერის ღილაკების გამოყენებით.
  • 4 ბირთვიანი პროცესორების მხარდაჭერა. ეს საშუალებას გაძლევთ შეამციროთ ამოცნობის დრო და გადაიყვანოთ რამდენიმე სურათი ერთდროულად.
  • საკუთარი ელექტრონული ბიბლიოთეკის შექმნა Kindle e-reader-ისთვის (ელექტრონული წიგნი).
  • ავტომატური გამოვლენააღიარებული ენა.

პროგრამის მინუსებს შორისაა: დაბალი სიჩქარემუშაობა მე-10-თან შედარებით FineReader-ის ვერსია, ხოლო ლიცენზირებული ასლის ფასი 150 დოლარია.

სისტემის მოთხოვნები:

  • პროცესორი: x32- ან x64-bit, 1 გჰც-ზე მეტი საათის სიხშირით, Intel Pentiumდა უკეთესი, AMD Athlon და უკეთესი.
  • ოპერატიული მეხსიერება: 512 MB.
  • ვიდეო კარტა: ნებისმიერი, რომელიც მხარს უჭერს 1024 x 800 გარჩევადობას და 16 ბიტიან ფერთა სიღრმეს.
  • მყარი დისკი: 1.1 GB ყველა კომპონენტის ინსტალაციისთვის და 100 MB მუშაობისთვის.
  • სკანერი: მხარს უჭერს TWAIN, WIA და ISIS დრაივერებს.
  • ოპერაციული სისტემა: Windows XP SP3, Vista SP2 x32/x64, 7.8.

მომხმარებელთა მოსაზრებები OmniPage-ის შესახებ

ძალიან უარყოფითად საუბრობენ მასზე, რადგან... პრობლემებია პროგრამის ყველა ნაწილში, ლამაზი, მაგრამ გაუგებარი ინტერფეისიდან დაწყებული, დახმარების ცუდი ინფორმაციამდე. პროდუქტი არ არის ადაპტირებული WinXP-ში მუშაობისთვის. ის შეიძლება იმუშაოს, მაგრამ ამას გარკვეული დრო დასჭირდება.

OmniPage-ს ამოცნობის პრობლემები აქვს. მაგალითად: ადვილად ამოიცნობს მარტივ შავ ტექსტს ფურცელზე სკანერიდან მიღებული სურათებით ან ცხრილებით. კამერიდან სურათების გამოყენებისას ან მობილური ტელეფონიამოცნობის სიზუსტე ეცემა 70%-მდე და ეს ძალიან მოუხერხებელია დიდი დოკუმენტების დამუშავებისას.

ასევე, ვერსია 18 შეიძლება არ დაიწყოს კოდის შეცდომების გამო. ამ პრობლემის გადასაჭრელად თქვენ უნდა დააინსტალიროთ პატჩი 18.01.

წაიკითხეთ Iris Pro 17

Read Iris არის OCR პროგრამა, რომელიც ნაკლებ ფულზე (8000 12000-ის წინააღმდეგ) ფუნქციონალურობითა და შესრულებით FineReader-ს შეედრება. პროფესიონალურ ვერსიას აქვს შემდეგი მახასიათებლები:

  • სრული მუშაობა PDF-თან: ამოცნობა, მონაცემთა ბაზებისთვის ფაილების შექმნა, ტექსტის შეკუმშვა და მეტყველება.
  • მხარს უჭერს 140 ენას.
  • ქაღალდის ცხრილების და ტექსტების ამოცნობა Excel-ში და Word-ში ექსპორტის შესაძლებლობით.
  • მიიღეთ სურათები ნებისმიერი სკანერის მოდელიდან.

ასევე არსებობს საწარმოს ვერსია, რომელიც საშუალებას გაძლევთ დაიცვათ PDF ფაილები წყლის ნიშნებით და იმუშაოთ 50 გვერდზე მეტ დოკუმენტებთან.

სისტემის მოთხოვნები:

  • პროცესორი: x86 ან x64, 1 გჰც ან უფრო მაღალი.
  • ოპერატიული მეხსიერება: 1 GB.
  • ვიდეო კარტა: ნებისმიერი, რომელიც მხარს უჭერს 1024 x 800 გარჩევადობას.
  • მყარი დისკი: 400 მბ ინსტალაციისთვის.
  • სკანერი: მხარს უჭერს TWAIN, WIA დრაივერებს.
  • ოპერაციული სისტემა: Windows 7,8,10 x32/x64.

მომხმარებლების მოსაზრებები ReadIris-ის შესახებ

ისინი განიხილავენ ამ OCR ტექსტის ამოცნობის პროგრამას, როგორც კარგ და სწრაფ PDF-ს სიტყვების გადამყვანიმთელი რიგი პრობლემებით:

  • რთული ინტერფეისი, რომლის გაგება არც ისე ადვილია დამწყებთათვის.
  • ავტომატურად ხელახლა ასკანირებს დოკუმენტს, როდესაც სკანირების არეალი იცვლება.
  • ცუდი ტექნიკური მხარდაჭერა.
  • ზოგჯერ პროგრამა არ აქტიურდება პროგრამის კოდში შეცდომის გამო.

Samsung Scan OCR პროგრამა - რა არის ეს პროგრამა?

ეს არის უფასო პროგრამული უზრუნველყოფა, რომელიც შედის 3-ში-1 მრავალფუნქციურ მოწყობილობებთან (პრინტერი, სკანერი, ქსეროქსი) Samsung-ისგან. ის შეიქმნა Iris-თან, ReadIris Pro-ს მწარმოებლებთან თანამშრომლობით და ოპტიმიზირებულია მწარმოებლის MFP-ებთან მუშაობისთვის. Samsung Scan ORC ორიგინალური "Ridiris"-ისგან განსხვავდება ინტერფეისით, შემცირებული ფუნქციონალობით და ზომით - მყარ დისკზე 40 მბ იკავებს.

ონლაინ სერვისები

ისინი რესურსებით ინტენსიური დესკტოპის ტექსტის ამოცნობის პროგრამების ალტერნატივაა. მაგალითად, OCR პროგრამა FineReader. ასეთი პროექტების სისტემების თვისებები შესაძლებელს ხდის სურათებიდან ტექსტის ამოცნობას ბევრად უფრო სწრაფად, ვიდრე დამოუკიდებელ კომპიუტერზე. სერვისებს შორის, რომლებიც ამოიღებენ ტექსტს ფოტოებიდან, არის 3 ყველაზე მოსახერხებელი: FineReaderOnline, FreeOCR, OnlineOCR.

პირველი არის პროდუქტის სტაციონარული ვერსიის პირდაპირი განვითარება. რეგისტრაციისას ახალ მომხმარებელს ეძლევა 10 უფასო გვერდი დასამუშავებლად და 5 ყოველთვიურად. ამ შეზღუდვის მოხსნა შეგიძლიათ წლიური ხელმოწერის შეძენით 3200, 5500, 17800 რუბლით 2000, 5000 და 10000 გვერდისთვის, შესაბამისად. თუ მომხმარებელს აქვს FineReader 14-ის ლიცენზია, მაშინ მას უბრალოდ უნდა დარეგისტრირდეს და გაააქტიუროს იგი ონლაინ ვერსიაში გამოსაყენებლად. ამ შემთხვევაში იგი მიიღებს შეძენილი ლიცენზიის ტიპის შესაბამისი გვერდების რაოდენობას: „სტანდარტი“ (2000), „ბიზნესი“ (5000) ან „საწარმო“ (10000).

OnlineOCR.com სერვისი გაძლევთ საშუალებას გადაიყვანოთ 15 სურათი/საათი (ლიმიტი დაურეგისტრირებელი მომხმარებლებისთვის) ტექსტად და შეინახოთ ისინი .docx, .xlsx ან .txt ფაილებად. რეგისტრაციის შემდეგ ხელმისაწვდომი ხდება შემდეგი:

  • შენახვა .pdf, .doc, .xlx, .rtf.
  • მრავალგვერდიანი PDF ფაილების კონვერტაცია.
  • გვერდების რაოდენობა იზრდება 50-მდე.

თუ არ არის საკმარისი გვერდები, მაშინ მათი შეძენა შესაძლებელია 50-50,000 ცალი რაოდენობით.

FreeOCR.com პროექტი განსხვავდება წინასგან იმით, რომ ის სრულიად უფასოა და არ აქვს შეზღუდვები დამუშავებული გვერდების რაოდენობაზე. ამ საიტის OCR ძრავა მხარს უჭერს რუსულ, უკრაინულ, თურქულ, ვიეტნამურ და ყველა ევროპულ ენებს - მთლიანობაში 29 ამ პორტალის ერთადერთი ნაკლი ის არის, რომ ის მუშაობს მხოლოდ თანმიმდევრულად ჩატვირთული გრაფიკული გამოსახულებით, რადგან დამუშავების რიგი არ არის. შემქმნელების მიერ მოწოდებული. აღიარებული ინფორმაცია ნაჩვენებია ყოველგვარი ფორმატირების გარეშე TXT ფორმატში.

მომხმარებელთა მოსაზრებები ონლაინ OCR სერვისების შესახებ

ეს საიტები აუცილებელია იმ შემთხვევებში, როდესაც სრულფასოვანი ORC პროგრამის ჩამოტვირთვა და ინსტალაცია არაპრაქტიკულია. მაგალითად, ჩასვათ რამდენიმე გრძელი ციტატა წიგნიდან ან ჟურნალიდან აბსტრაქტში. ასეთი საიტების ნაკლოვანებებს შორის არის პირობითი თავისუფალობა (FineReader) და სუსტი ფუნქციონირება (FreeOCR, OnlineOCR).

შეჯამებისთვის, შეგვიძლია ვთქვათ, რომ შეიქმნა უამრავი OCR პროგრამა სურათებით ან PDF ფაილებით ტექსტის ამოცნობისთვის და სტატიაში წარმოდგენილია მხოლოდ ყველაზე ცნობილი. აქედან გამომდინარე, თითოეულ მომხმარებელს შეეძლება აირჩიოს OCR პროგრამა სკანერისთვის მათი მოთხოვნებისა და ბიუჯეტის შესაბამისად. ან გამოიყენეთ OCR მრავალი უფასო სერვისიდან ერთ-ერთი.

OCR CuneiForm შეძლებს ქაღალდის დოკუმენტაციის სკანირებას და მყისიერად ამოცნობას ოპტიკური სიმბოლოების ამოცნობის ტექნოლოგიის გამოყენებით რედაქტირებადი ტექსტისა და ცხრილის ფორმატებში, რომლებიც თავსებადია Microsoft-თან. Office Wordდა Excel. მაშინ უმჯობესია შეინახოთ და დაარედაქტიროთ მასალები საოფისე პაკეტები, ტექსტისა და ცხრილების რედაქტორები, Microsoft-ის ანალოგები Word და Microsoft Excel. პროგრამა ნაწილდება "როგორც არის", დეველოპერები არ არიან პასუხისმგებელი შესაძლო პრობლემებიდა შეიძლება გააუქმოს უფასო ლიცენზია მომავალი ვერსიებისთვის, ასე რომ თქვენ უნდა იჩქაროთ და უახლესი ვერსია OCR CuneiForm უფასო ჩამოტვირთვა Windows 10, 8.1, 8, 7, Vista, XP, Linux ან Mac OS X-ისთვის. დეველოპერები გვთავაზობენ დროის დაზოგვას CuneiForm-ით პრინციპის მიხედვით: რაც უფრო უკეთესია სკანირება და ამოცნობა, მით უფრო სწრაფია. გაასწორეთ და მიიღეთ დასრულებული შედეგი.

ახალი ტექნოლოგიური მიღწევების გამოყენება CuneiForm-ში

21-ე საუკუნის დასაწყისში ითვლებოდა, რომ ABBYY FineReader-ის სათანადოდ მოქმედი ალტერნატივა არ არსებობდა. OCR ტექსტის ამოცნობის სხვადასხვა პროგრამების არსებობის მიუხედავად, ABBYY FineReader მტკიცედ რჩებოდა დოკუმენტების სკანირებისა და დიგიტალიზაციის ინდუსტრიის ლიდერებს შორის. ეს გაგრძელდა მანამ, სანამ ყველაზე მოწინავე მომხმარებლები ცდილობდნენ სრულად ამოეცნოთ გადაღებული ან დასკანირებული ტექსტი OCR CuneiForm 12 უფასოდ რეგისტრაციისა და SMS-ის გარეშე ჩამოტვირთვით და Windows-ისთვის ამ მართლაც უფასო პროგრამის პოტენციალის ტესტირებით. აღმოჩნდა, რომ CuneiForm-ის OCR შესაძლებლობები არანაირად არ ჩამოუვარდება ABBYY FineReader-ს.

OCR CuneiForm-ს შეუძლია მყისიერად ამოიცნოს სხვადასხვა სტილისა და შრიფტის დიზაინის ყველა სტანდარტული სიმბოლო. შეიძლება ამოიცნოთ წიგნები, ჟურნალები, ბუკლეტები, გაზეთები, ბეჭდური ფურცლები, ფაქსის გაგზავნა, წარუმატებელი ქსეროქსის ასლები, ტექსტები უძველესი საბეჭდი მანქანებიდან და ა.შ., დეკორატიული შრიფტებისა და ხელნაწერების გამოკლებით. IN პროგრამის კოდი CuneiForm იყენებს უამრავ უნიკალურ ინოვაციურ ოპტიკური სიმბოლოების ამოცნობის ტექნოლოგიებს, როგორიცაა: ადაპტური ამოცნობა შრიფტისაგან დამოუკიდებელი ინსტრუქციების გამოყენებით, ნერვული ანალიტიკური ნორმალიზების ქსელები, ტექსტის ალტერნატიული ინტერპრეტაციის კოგნიტური ანალიტიკა, სპეციალური ალგორითმები მატრიცული პრინტერისთვის, დაბალი ხარისხის ფოტოკოპირების შედეგები, ფაქსები. და საბეჭდი გვერდები და სხვა. თუ თქვენ გჭირდებათ ამ ყველაფრის გამოყენება ბიზნესისთვის, ყოველთვის შეგიძლიათ ჩამოტვირთოთ CuneiForm Windows 10-ისთვის, CuneiForm-ს შეუძლია ხელახლა შექმნას საწყისი კოდის აბსოლუტური ასლი. შენარჩუნებულია ფორმატირება და სტრუქტურირება, შეწევა, სათაურები და ქვედა კოლონტიტულები, სქოლიოები, ინდექსები, სვეტების რაოდენობა და ზომები, აბზაცები, ცალკეული ტექსტის ფრაგმენტების განლაგება, ცხრილის ელემენტები და ილუსტრაციები, შრიფტის სტილი და შრიფტის დიზაინის სხვა ელემენტები.

OSR CuneyForm-ის ინტერფეისი, ენები, ლექსიკონები და ფუნქციონალობა

OCR CuneiForm შესანიშნავად ცნობს და ციფრულ დოკუმენტაციას, მარტივი გამოსაყენებელია და არ უქმნის პრობლემებს ახალბედა მომხმარებლებისთვის, რადგან მას აქვს მოსახერხებელი რუსულენოვანი ინტერფეისი, ჩაშენებული რჩევები და ინსტრუმენტების რჩევები. პოპულარული გრაფიკული ინტერფეისები CuneyForm-ისთვის ხელმისაწვდომია ჩამოტვირთვისა და დასაკავშირებლად: YAGF, OCR Feeder, CF-Qt, Puma და სხვა. სტანდარტული GUIაქვს ყველა ხელსაწყო, რომელიც აუცილებელია დასკანირებული ან გადაღებული ტექსტის სრული ამოცნობისთვის. მრავალენოვანი ინტერფეისი მშობლიურ ენაზე ეხმარება დააჩქაროს ოპერატორის მიერ ოპერაციული პრინციპების გაგება და გაფართოვდეს გამოყენებული შესაძლებლობების სპექტრი. პარამეტრებში კონფიგურაცია ხელმისაწვდომია სიმბოლოების ამოცნობისთვის რუსულ, ინგლისურ, რუსულ-ინგლისურ და 20 სხვა ევროპული ენის განლაგებაში. მყისიერი ამოცნობის ხარისხი უმჯობესდება ლექსიკონების გამოყენებისას, რაც შეიძლება გაფართოვდეს ლექსიკონის ფაილებიდან სიტყვების იმპორტით.

OCR CuneiForm პროგრამის ძირითადი ფუნქციური უპირატესობები:

  • ღირსეული OCR ამოცნობა და სიჩქარე,
  • ავტომატური შერჩევა ოპტიმალური პარამეტრებისკანირება,
  • სკანირებული, გადაღებული ან სხვაგვარად მიღებული სურათების იმპორტი,
  • როტაცია, გადაბრუნება, ინვერსია, გაწმენდა და სხვა გამოსახულების რედაქტირება,
  • რამდენიმე ვარიანტი ტექსტის აბზაცების, ცხრილების და სურათების იდენტიფიკაციისთვის,
  • მიმდინარეობს მუშაობანებისმიერი მასალა, დეკორისა და ხელნაწერის გარდა,
  • ლექსიკის მხარდაჭერა ხარისხის გასაუმჯობესებლად,
  • წყაროებისა და სიმბოლური შედეგების შედარებითი დემონსტრირება,
  • OCR თავსებადობა ოცზე მეტ ენასთან, მათ შორის რუსულთან.

თავისუფლება, მრავალი უპირატესობა, სიჩქარე და მუშაობის პრობლემების არარსებობა არის ძლიერი არგუმენტი CuneiForm უფასოდ ჩამოტვირთვისთვის რუსული ვერსიის ვებსაიტზე. მაღალტექნოლოგიური საშუალებების გამოყენება გარანტიას იძლევა მაღალი ხარისხის სკანირებას და დოკუმენტაციის ამოცნობას ქაღალდის ან რასტრული ფაილებიდან შესაბამის რედაქტორებში რედაქტირებისთვის შესაფერის ფორმატებში.

ზოგიერთი ისტორიული ფაქტი

Cognitive Technologies ჩამოყალიბდა 1993 წელს რუსეთის მეცნიერებათა აკადემიის მთავარი AI ცენტრის ბაზაზე. სამეცნიერო და პრაქტიკული კვლევის შედეგად, პირველი CuneiForm გამოჩნდა. 1993 წლის ბოლოს, Corel Corporation-თან გაფორმდა OEM კონტრაქტი, რომლის მიხედვითაც CuneyForm კოდი ჩართული იყო Corel Draw პაკეტში. შემდგომში, მრავალწლიანი პაუზის შემდეგ, კომპანიამ გამოუშვა პროექტი, შეწყვიტა პროგრამის გაყიდვა და მხარდაჭერა, მაგრამ CuneiForm პროგრამა იმდენად კარგია, რომ დღეს რუსული ტექსტის სკანირებისა და ამოცნობის საუკეთესო და იაფი გზა არის OCR CuneiForm რუსული ვერსიის ჩამოტვირთვა. უფასოდ თქვენს კომპიუტერში.

მალე ეს პროგრამული პროდუქტი აღმოჩნდა ერთ-ერთი ყველაზე პოპულარული ოპტიკური ტექსტის ამოცნობის ინსტრუმენტი და დაიმსახურა მომხმარებლების დადებითი მიმოხილვები და კომენტარები ოფიციალურ შემეცნებითი ფორმების ვებსაიტზე com დომენში, თემატურ საიტებსა და ფორუმებზე, ასევე სოციალური ქსელები. დღეს CuneiForm გამოირჩევა სხვა ოპტიკური სიმბოლოების ამოცნობის პროგრამული უზრუნველყოფის ბრბოსგან დაბალი ხარისხის დოკუმენტაციის შესანიშნავი ამოცნობით. KuniForm-ის უპირატესობებს შორისაა ქაღალდის დოკუმენტაციისა და რასტრული ფაილების მაღალი ხარისხის ციფრული თარგმანი მრავალფორმატიან ტექსტში და Microsoft Office Word და Excel ცხრილებში ან მათ ანალოგებში ექსპორტით.

შეცდომა სკანერებთან ურთიერთქმედებისას

HP-ზე, Epson-ზე, Mustek-ზე, Canon-ზე და ზოგიერთ სხვაზე სკანირება სავსეა შეცდომით. ამ პრობლემის მიზეზი არის მოწყობილობასთან TWAIN ინტერფეისის ურთიერთქმედების ნიუანსი. პრობლემის გადაჭრა შესაძლებელია C:\Windows\face.ini ფაილში TWAIN_TransferMode-ის შიგთავსით ხაზის უბრალოდ რედაქტირებით: TWAIN_TransferMode=memory-native და გადატვირთეთ პროგრამა. როგორც წესი, დღეს ასეთი პრობლემები არ შეინიშნება და იმისათვის, რომ მიიღოთ რედაქტირებადი ელექტრონული ვერსია ქაღალდის დოკუმენტიდან, თქვენ უბრალოდ უნდა ჩამოტვირთოთ CuneiForm რუსულ ენაზე უფასოდ ვებგვერდის ამ გვერდიდან რეგისტრაციისა და SMS-ის გარეშე და გამოიყენოთ იგი დანიშნულებისამებრ. ეს დაზოგავს დროს და გაგათავისუფლებთ ტექსტის ხელით აკრეფისგან Microsoft Word-ში და ცხრილების Microsoft Excel-ში ან მსგავს პროგრამულ უზრუნველყოფაში.

ჩამოტვირთეთ CuneiForm 12-ის უახლესი ვერსია უფასოდ რუსულ ენაზე

უფასო პროგრამების ჩამოტვირთვა უფასოდ

ახლა თქვენ იმყოფებით საიტის გვერდზე სახელწოდებით "OCR CuneyForm გადაღებული ან დასკანირებული ტექსტის სრული ამოცნობისთვის", სადაც ყველას აქვს შესაძლებლობა ლეგალურად ჩამოტვირთოს პროგრამები კომპიუტერისთვის. Microsoft Windows. ეს გვერდი შეიქმნა/არსებითად განახლდა 09/10/2015. გმადლობთ, რომ ეწვიეთ განყოფილებას.

© 2024 ermake.ru -- კომპიუტერის შეკეთების შესახებ - საინფორმაციო პორტალი