Wednesday, February 17, 2016

GOCR - Image to Document Convert App

Leave a Comment
සරලව කියනවා නම් GOCR කියන්නේ තීර්ථ යාත්‍රිකයා විසින් රචිත කාව්‍යක් (ස්ක්‍රිප්ට් එකක්). :D . මේක භාවිතා කරලා පින්තූරයක තියන අකුරු සංස්කරණය කරන්න පුලුවන් ආකාරයක ඩොකියුමන්ට් එකකට ගන්න පුුලුවනි (වර්ඩ් ඩොකියුමන්ට් එකකට). 

පොර ටෝක් එකක් විදිහට මහාප්‍රාණෙන් කියනවා නම් - GOCR යනු Optical Character Recognition තාක්ෂණය භාවිතා කර ගූගල් හි අති ප්‍රබල ක්ලවුඩ්  සේවය මත පදනම් වූ Optical Character Recognition මෘදුකාංගයකි.  :D .

ඇත්තටම මේක එහෙම පොර ටෝක් දෙන්න ඕන එකක් නෙවෙයි. අන්තිම සරල කෝඩ් කීපයක් පාවිච්චි කරලා ගූගල් ඩ්‍රයිව් එකේ තියන OCR පහසුකම ඇප්ලිකේෂන් එකක් විදිහට පාවිච්චි කරන්න හදාපු ස්ක්‍රිප්ට් එකක්. මේකෙ බේස් එක උනෙත් වෙන කෙනෙක් ලියපු ස්ක්‍රිප්ට් එකක්. හැබැයි මහාප්‍රාණෙන් කියපුවාම ෆයිල් එකක් කොපි පේස්ට් කරන එක උනත් හරි සංකීර්ණ විදිහට කියන්න පුලුවන්. ගොඩක් මාකටින් කරන උං ඔය වගේ ඒවා කියලා තමයි ක්ලයන්ට්ලා රවට්ටලා ගාන කඩාගන්නේ :D .

නිධාන කතාව
තීර්ථ යාත්‍රිකයා වැඩ කරන තැන ප්‍රොෙජක්ට් එකකට අවශ්‍ය උනා පින්තූර වල තියන අකුරු සංස්කරණය කරන්න පුලුවන් විදිහේ ගොනු බවට පත්කරන ක්‍රමයක්. ඒ සඳහා OCR ලයිබ්‍රීස් කීපයක්ම තිබුනත් අපිට ප්‍රධාන ප්‍රශ්නය උනේ ඒ ලයිබ්‍රීස් සිංහල සඳහා හරිහැටි සහාය නොදැක්වීම. Tesseract-ocr සෑහෙන දුරට සිංහල භාෂාවට සහාය දැක්වුවත් සිංහල භාෂාව සඳහා එය පුහුණු කිරීම කාලය ගතවන වැඩක් විදිහටයි තීර්ථ යාත්‍රිකයාට තේරුනේ. PHP පාවිච්චි කරලා ඇප්ස් ලියන තීර්ථ යාත්‍රිකයලාට C, Java එක්ක ඕවා කරන්න වෙලාවක් නැහැ නෙව :D .

ගූගල් ඩ්‍රයිව් එකට පින්තූර ගොනුවක් අප්ලෝඩ් කරලා ඒක වර්ඩ් ෆයිල් එකකට කන්වර්ට් කරගන්න පුලුවන්. ඒවගේම ගූගල් වල OCR එන්ජින් එක සිංහල වලට සෑහෙන හොඳ බව තේරුනා. ඒ නිසා තීර්ථ යාත්‍රිකයා කලේ Google Drive API එක හරහා අවශ්‍ය කාර්යය කරගත්තු එක.

වාණිජ ව්‍යාපෘතියක් නිසා හදපු සම්පූර්ණ ඇප්ලිකේෂන් එක එළියට දෙන්න බැරි උනත් කාට හරි බේස් එක විදිහට පාවිච්චි කරන්න පුලුවන් ආකාරයේ සරල ඇප්ලිකේෂන් එකක් විදහට මේක එළියට දෙන්න තීර්ථ යාත්‍රිකයා හිතුවා. අපි වැඩිහරියක් කරන්නේ අනික් මිනිස්සු සල්ලි  ගැන නොහිතා තමන්ගේ දැනුමෙන් කරපු ඇප්ලිකේෂන්, ස්ක්‍රිප්ට් පාවිච්චි කරන එක .එහෙව් එකේ පුලුවන් හැටියට අපිත් ස්ක්‍රිප්ට් කෑල්ලක් දෙකක් දාන එක හොඳයිනේ :) .

බාගත කිරීම
Github එකේ මේක තියනවා. කියන්න බැරි උනා. මම මේකට උපකාර කරගත්ත බේස් ඇප් එකට ලිංක් එකත් ගිට් හබ් පේජ් එකේ තියනවා. මේකට GOCR කියන්නේ Google OCR සේවය මත පදනම් වූ නිසා.

වැඩ කරන හැටි
  1. ගූගල් ඩිවලොපර් කොන්සෝල් එකට ගිහිල්ලා ඇප්ලිකේෂන් එකක් හදලා Client Secret Json File එක ගන්න.
  2. ඩවුන්ලෝඩ් කරගත්ත ෆයිල් සෙට් එකේ තියන Client Secret File එක අයින් කරලා 1 ට කියපු ෆයිල් එක දාගන්න.
  3. ක්ලයන්ට් සීක්‍රට් එකේ තියන Redirect URI කියන තැනට ඔයාගෙ ෆයිල් සෙට් එකේ තියන fileupload.php කියන ෆයිල් එකේ පාත් එක දෙන්න.
  4. formaction.php කියන ෆයිල් එක ඕපන් කරලා $permission_data කියන එක සර්ච් කරලා (Line 178) ඔයාගේ ජීමේල් ඇඩ්‍රස් එක දෙන්න.
  5. එච්චරයි. මේක රන් කරන්න ඕන වෙබ් සර්වර් එකක් හරහා කියලා අමුතුවෙන් කියන්න ඕනෙ නෑනේ.
  6. ප්‍රොෙජක්ට් එක රන් කලාම ෆයිල් එක අප්ලෝඩ් කරන තැනට අවශ්‍ය පින්තූර ෆයිල් එක දුන්නාම වර්ඩ් ඩොකියුමන්ට් එකක් ඩවුන්ලෝඩ් වේවි.
සැලකිය යුතුයි
  • මේක පලවෙනි වර්ශන් එක ඒ නිසා අඩුපාඩු තියෙන්න පුලුවන්.බග්ස් ආවොත් කියන්න.
  • මේක සම්පූර්ණ ඇප් එකක් නෙවෙයි , මේක මොකක් හරි ඇප් එකකට බේස් එක විදිහට පාවිච්චි කරන්න පුලුවන්.
  • මේකට තව මොනවා හරි එකතු වෙන්න ඕන කියලා හිතෙනවා නම් මට කියන්න. ඔබටම ඒ දේ කරන්න පුලුවන් නම් ෆෝර්ක් කරගෙන ඔබගේම ප්රොජේක්ට් එකක් විදිහට කරගන යන්න එහෙමත් නැතිනම් මට පුල් රික්වෙස්ට් එකක් දාන්න. මම මාස්ටර් බ්‍රාන්ච් එකට මර්ජ් කරන්නම්.
  • ඩවුන්ලෝඩ් කරගන්න, පාවිච්චි කරන්න , වෙනස් කරන්න , අලුත් දෙයක් ලෝකයට දෙන්න.


  

0 ප්‍රතිචාර:

Post a Comment

අදහස්, උදහස්....

.