بازیابی عکس شخص فقط با نمونه صدا

در مقاله های گذشته در مورد هوش مصنوعی، چگونگی ساخت آن و کاربرد های آن توضیح دادیم. در این مقاله به موضوع جذاب بازسازی چهره از روی نمونه صدای فرد می پردازیم.

شاید برای شما هم این اتفاق افتاده باشد که هنگامی که صدای یک فرد آشنا را می شنوید، ظاهر آن شخص در ذهن شما تصور شود. حال به این فکر کنید که یک همچین اتفاقی در عالم واقعی توسط هوش مصنوعی امکان پذیر باشد. اکنون این تکنولوژی با استفاده از هوش مصنوعی و توسط یک بانک عظیم از داده ها در حال عملی شدن است. این اتفاق تنها با استفاده از یک فایل صوتی کوتاهی از صدای فرد مورد نظر امکان پذیر شده است.

شبکه عصبی Speech2Face می تواند با صدای فرد چهره آن را باز سازی کند. برای شما هم سوال است که چگونه این عملیات اتفاق خواهد افتاد؟

گروهی از محققان MIT با استفاده کردن از چندین میلیون ویدیو ضبط شده از ۱۰۰ هزار فرد مختلف توانسته اند با یک کامپویتر مجهز به شبکه عصبی Speech2Face به این امر دسترسی پیدا کنند. شبکه عصبی SpeechtoFace می تواند شبیه به مغز انسان کار کند. این تکنولوژی با استفاده از بانک عظیم ویدیویی و آنالیز چهره فرد در هنگام گفت و گو می تواند عکس های واقعی از چهره تولید کند. این تکنولوژی قادر است که حالت های چهره در هنگام بیان جملات خاص را تشخیص دهد و با سنجش نمونه صوت های افراد مختلف با دیتابیسی که دارد چهره افراد را بازسازی کند.

دانشمندان بعد از آزمایش نسخه آزمایشی دریافتند که این تکنولوژی توانسته است به صورت خیلی خوبی نژاد، محدوده سنی و حتی جنسیت افراد را به درستی تشخیص دهد.

محققان MIT معتقدند که این سیستم فعلا می تواند با استفاده از نمونه صوتی دریافتی تنها یک میانگین از چهره های موجود را پردازش کرده و نمایش دهد و هنوز نمی تواند چهره واقعی یک فرد را بازسازی کند اما همان طور که گفته شد این تصویر میانگین تا حدودی از نظر محدوده سنی؛ نژاد و جنسیت صحیح است. اما با این که هوش مصنوعی در این تکنولوژی بسیار پیشرفته عمل کرده است اما نواقصی را هم دارد. به عنوان مثال اگر زبانی که شما در نمونه صوتی صحبت می کنید تغییر کرده باشد؛ یعنی اگر یک بار با زبان کره ای صحبت کنید و دفعه بعد با زبان انگلیسی ممکن است در نمونه اول شما را یک فرد که در شرق آسیا زندگی می کند – و ویژگی های آن ناحیه از جمله زردی پوست را دارد – نشان دهد اما اگر همین فرد با زبان انگلیسی صحبت کند به صورت یک فرد سفید پوست تلقی می گردد.

به گفته محققان داده های محدودِ مورد استفاده برای یادگیری که از یوتیوب استخراج شده از دلایل دقت کم این سیستم است. این چنین مشکلاتی می تواند به تعصب نژادی و جنسیتی هوش مصنوعی هم منجر شود.

شاید این فناوری در آینده با پیشرفت بیشتر بتواند در زمینه شناخت مجرمان مفید باشد و البته شاید هم به ابزاری برای نقض حریم خصوصی بدل شود.

فهرست