مسابقه ICML 2013 به تشخیص 35 کلاس مختلف از پرندگان با استفاده از صدای پیوسته ضبط شده آنها در سه مکان مختلف، میپردازد. داده ها توسط تاریخ طبیعی، یکی از معتبرترین موسسات بررسی پرنده در جهان ارائه شده است.
برای اطلاعات بیشتر و دریافت داده میتوانید به صفحه مربوط به مسابقه رجوع کنید.
۱. مقدمه
بشر از ابتدا به طور مداوم به دنبال ایجاد شرایط آسان و بهتری برای زندگی خود بوده است.آنگاه به وسیله صدا توانسته است به ارتباط با دنیای پیرامون خوپ بپردازد که در طول تاریخ منجر به تولید زبانهای مختلفی شد. پس از آن به بررسی ماهیت صدا پرداخت و تاکنون توانسته است به فناوری تشخیص کلمه از روی صدا دست یابد که منجر به برقراری ارتباط راحت با دنیای زبانهای غیرمادری شد.
گاهی اوقات در سیستمهای هوشمصنوعی که از فناوری تشخیص تصویر از روی یک نمونه ویدیویی(شامل صدا) استفاده می شود،امکان تشخیص اشتباه به وجود آید که به یک آموزشدهنده برای تصحیح اشنباه نیاز است، و ممکن است که آموزش دهنده متوجه رخ دادن اشتباه نشود. فناوری تشخیص صدا،می تواند در تعامل با دیگر فناوریهای هوشمصنوعی، شامل تشخیص تصویر، منجر به خودآموزی بیشتر سیستمهای هوشمصنوعی شود که نقش آموزش دهنده را کمتر و یا هوشمندتر می کند. بدین گونه که برای مثال اگر یک عامل هوشمصنوعی در یک تصویر به همراه فایل صوتی آن، وجود پرنده کلاغ را تشخیص دهد ولی فناوری تشخیص صدا،حضور پرنده دیگری را از روی فایل صوتی آن تشخیص دهد که هیچ شباهتی به صدای کلاغ ندارد(با توجه به خروجی آن) آنگاه میتوان به سیستم تشخیص تصویر به صورت خودکار آموزش داد که آن پرنده، کلاغ نمی باشد بلکه پرنده ایست که به وسیله سیسم تشخیص صدا مشخص شده است.
اینک می توان به وسیله فناوری تشخیص صدا،سیستمهای هوش مصنوعی را هوشمند تر کرد.
همچنین، در مواردی که در صدای دریافتی از محیط و یا ارتباطات کلامی از طریق دستگاههای ارتباطی دچار اختلال در وضوح صدا شویم که تشخیص کلمه دشوار و یا ناممکن باشد،میتوان با سیستم تشخیص صدا مشکل را برطرف کرد.