تشخیص هویت از چهره
سیستم تشخیص هویت از چهره از یک ماژول تشخیص چهره برای پیداکردن چهرههای
موجود در تصویر و استخراج آن ها و یک ماژول شناسایی چهره برای شناسایی هویت فرد
با استفاده از یک دیتابیس چهره تشکیل شده است.
قابلیت های این سیستم به شرح زیر است:
✓ تشخیص چهره با دقت باال ) %99.65 برروی تصاویر افراد از نژادهای
خاورمیانهای(
✓ شناسایی چهره تمامرخ با دقت باال )%93 برروی چهره افراد از نژادهای خاورمیانهای(
✓ سرعت اجرای باال )حدود 200 عکس در ثانیه بررروی یک سیستم پردازشی متوسط(
برخی از کاربردهای احتمالی این سیستم عبارتند از:
✓ تشخیص هویت افراد با استفاده از دیتابیس چهره
✓ جست وجوی یک فرد در تصاویر دوربینهای نظارتی
✓ تحلیل حضور افراد در مکانهای متفاوت
✓ تشخیص حضور افراد غیرمجاز
✓ احراز هویت افراد با استفاده از چهره
استخراج متن از روی تصاویر
سیستم استخراج متن از روی تصاویر)OCR)، با استفاده از هوش مصنوعی در مرحله اول به
استخراج بخشهایی از تصویر که دارای متن باشند پرداخته و در مرحله بعد به تشخیص
متون نوشته شده در هر بخش میپردازد.
قابلیتهای این سیستم به شرح زیر است:
✓ تشخیص متون فارسی، عربی و انگلیسی در تصاویر
✓ قابلیت آموزش مدل برروی زبانهای جدید
✓ سرعت اجرای باال
برخی از کاربردهای احتمالی این سیستم عبارتند از:
✓ تشخیص متون موجود در تصاویر
✓ استخراج متن از اسناد به طور خودکار و تحلیل متون استخراج شده با استفاده از سیستمهای تحلیل متن
✓ استخراج اطالعات هویتی از اسناد
✓ استخراج اطالعات از قالبهای متنی تعیین شده
پروژه تشخیص گوینده
هدف از اجرای این پروژه آماده سازی سرویس یافتن گوینده مورد نظر از میان انبوه
گویندگان موجود در دیتابیس می باشد. در این سرویس از بروزترین مدل های مبتنی بر
یادگیری عمیق و همچنین تکنیک های پردازش صوت استفاده شده است.
ویژگیهای کلیدی:
✓ باالترین دقت در بین رقبای فارسی زبان.
✓ پشتیبانی از صوت های عادی با دقت باالی 92 درصد
✓ پشتیبانی قابل قبول از صوت هایی که در محیط های نویزی و شلوغ ضبط شده باشند.
✓ پشتیبانی قابل قبول از صوت هایی که در محیط های دارای انعکاس صوت هستند، ضبط شده باشند.
✓ استقالل سرویس تشخیص گوینده از گویش های مختلف فارسی و لحن های مختلف اعم از محاوره و رسمی.
✓ استقالل سرویس تشخیص گوینده از زبان و جنسیت گوینده.
✓ امکان مقایسه دو صوت به منظور تأ یید گوینده.
پروژه بازشناسی گفتار (تبدیل صوت به متن)
هدف از اجرای این پروژه آماده سازی سرویس تبدیل صوت
گوینده به متن با دقت و سرعت پردازش باال و در شرایط مختلف
و همچنین ارائه ابزار های کاربردی مختلف می باشد. در این
سرویس از بروزترین مدل های مبتنی بر یادگیری عمیق و همچنین تکنیک های پردازش صوت استفاده شده است.
ویژگیهای کلیدی:
✓ پشتیبانی از صوت های عادی با دقت باالی 92 )wer).
✓ باالترین دقت در زمینه صوت های میکروفونی رسمی در بین رقبای فارسی زبان.
✓ پشتیبانی از صوت های با طول بلند و کوتاه.
✓ پشتیبانی قابل قبول از صوت هایی که در محیط های نویزی و شلوغ ضبط شده باشند.
✓ پشتیبانی قابل قبول از صوت هایی که در محیط های دارای انعکاس صوت هستند، ضبط شده باشند.
✓ پشتیبانی از گویش های مختلف فارسی و لحن های مختلف اعم از محاوره و رسمی.
✓ ارائه ابزار BOOSTING WORD( اضافه کردن لغات تخصصی(
✓ امکان پردازش فایلها بصورت دسته ای به منظور افزایش سرعت