استخراج و ساختاردهی اسناد تایلندی در گوگل شیت با تایفون اوسیآر و لاما ۳.۱
استخراج اسناد
خلاصه قالب گردشکار n8n استخراج متن ساختاریافته از PDFهای تایلندی با Typhoon OCR
این قالب گردشکار n8n مخصوص کسبوکارها و تیمهایی است که نیاز به استخراج خودکار اطلاعات از اسناد PDF یا اسکنشده به زبان تایلندی و ثبت آنها در گوگل شیت دارند. این راهکار، با بهکارگیری پکیج Python «Typhoon OCR» (یکی از دقیقترین OCRهای متنی تایلندی)، پردازش را کاملاً ساده و اتوماتیک میکند و تنها مناسب نصبهای سلف هاست n8n است.
مزایا و کاربردها
- ایدهآل برای سازمانها و مشاغل محلیِ نیازمند ساماندهی بایگانی و گزارشهای تایلندی
- حل چالشهای ادغام Typhoon OCR در اتوماسیون؛ بدون نیاز به برنامهنویسی شخصی
- استخراج دادههای ساختاریافته و ثبت خودکار آنها در Google Sheets
مراحل اجرا
- اجرای دستی یا خودکار گردشکار
- بارگذاری PDFها از پوشه اختصاصی
- اجرای دستور Python با Typhoon OCR برای هر فایل
- پردازش نتیجه OCR توسط هوش مصنوعی (LLM) برای استخراج اطلاعات کلیدی
- ذخیره دادههای ساختاریافته در گوگل شیت
نکات راهاندازی
- نیازمند نصب Typhoon OCR و Poppler روی سرور
- تعیین پوشه فایلهای PDF و تنظیم ستونهای گوگل شیت طبق نمونه ارائهشده
- تنظیم API Key برای Typhoon و OpenAI/OpenRouter
این قالب، راهبری سریع و آسان اتوماسیون OCR اسناد تایلندی را بدون پیچیدگی فنی برای شما فراهم میکند.
یکپارچهسازیهای به کار رفته
E
این فرآیند با استفاده از پلتفرم n8n طراحی شده و قابلیت خودکارسازی بسیاری از فعالیتهای دیجیتال را فراهم میکند.
با دانلود فایل JSON این قالب، میتوانید آن را به راحتی در محیط n8n خود وارد کرده و تغییرات لازم را انجام دهید. مناسب برای توسعهدهندگان، مارکترها و تمام کسبوکارهایی که به دنبال خودکارسازی وظایف روزمره هستند.