سفارش ساخت ورکفلو

استخراج و ساختاردهی اسناد تایلندی در گوگل شیت با تایفون اوسی‌آر و لاما ۳.۱

تاریخ ایجاد: ۱۴۰۴/۳/۱تعداد بازدید: ۱٬۰۷۴مشاهده صفحه مرجع
استخراج اسناد

خلاصه قالب گردش‌کار n8n استخراج متن ساختاریافته از PDFهای تایلندی با Typhoon OCR

این قالب گردش‌کار n8n مخصوص کسب‌وکارها و تیم‌هایی است که نیاز به استخراج خودکار اطلاعات از اسناد PDF یا اسکن‌شده به زبان تایلندی و ثبت آن‌ها در گوگل شیت دارند. این راهکار، با به‌کارگیری پکیج Python «Typhoon OCR» (یکی از دقیق‌ترین OCRهای متنی تایلندی)، پردازش را کاملاً ساده و اتوماتیک می‌کند و تنها مناسب نصب‌های سلف‌ هاست n8n است.

مزایا و کاربردها

  • ایده‌آل برای سازمان‌ها و مشاغل محلیِ نیازمند ساماندهی بایگانی و گزارش‌های تایلندی
  • حل چالش‌های ادغام Typhoon OCR در اتوماسیون؛ بدون نیاز به برنامه‌نویسی شخصی
  • استخراج داده‌های ساختاریافته و ثبت خودکار آن‌ها در Google Sheets

مراحل اجرا

  1. اجرای دستی یا خودکار گردش‌کار
  2. بارگذاری PDFها از پوشه اختصاصی
  3. اجرای دستور Python با Typhoon OCR برای هر فایل
  4. پردازش نتیجه OCR توسط هوش مصنوعی (LLM) برای استخراج اطلاعات کلیدی
  5. ذخیره داده‌های ساختاریافته در گوگل شیت

نکات راه‌اندازی

  • نیازمند نصب Typhoon OCR و Poppler روی سرور
  • تعیین پوشه فایل‌های PDF و تنظیم ستون‌های گوگل شیت طبق نمونه ارائه‌شده
  • تنظیم API Key برای Typhoon و OpenAI/OpenRouter

این قالب، راهبری سریع و آسان اتوماسیون OCR اسناد تایلندی را بدون پیچیدگی فنی برای شما فراهم می‌کند.

یکپارچه‌سازی‌های به کار رفته

E
Google Sheets
Code
Read/Write Files from Disk
OpenRouter Chat Model

این فرآیند با استفاده از پلتفرم n8n طراحی شده و قابلیت خودکارسازی بسیاری از فعالیت‌های دیجیتال را فراهم می‌کند.

با دانلود فایل JSON این قالب، می‌توانید آن را به راحتی در محیط n8n خود وارد کرده و تغییرات لازم را انجام دهید. مناسب برای توسعه‌دهندگان، مارکترها و تمام کسب‌وکارهایی که به دنبال خودکارسازی وظایف روزمره هستند.