رمزگذارهای خودکار در بینایی رایانه ای

منبع: https://blog.keras.io/building-autoencoders-in-keras. html

رمزگذارهای خودکار در بینایی رایانه ای

پیاده سازی با پایتون

در مقاله قبلی من ، در مورد شبکه های مخالف تولیدی صحبت کرده ام ، یک کلاس از الگوریتم های مورد استفاده در Deep Learning که به دسته مدلهای مولد تعلق دارد.

در این مقاله ، من قصد دارم راه دیگری برای ایجاد تصاویر جدید ، با رویکرد متفاوت را معرفی کنم. الگوریتم هایی که ما برای این منظور استفاده می کنیم…

دانش آموزان Udacity فیلترهای Kalman ، Mini AV و دید رایانه را توضیح می دهند

دانش آموزان Udacity فیلترهای Kalman ، Mini AV و دید رایانه را توضیح می دهند

< /img>

در اینجا چند پست توضیحی عالی از دانشجویان Udacity Self-Driving Car در مورد فیلترهای کالمن ، دید رایانه و نحوه ساخت یک وسیله نقلیه کوچک مستقل آورده شده است.

فیلتر کالمن: شهود و مشتق از مورد جدا

Vivek Yadav

ویوک برخی از یادداشت های دوره کنترل پیشرفته خود را در SUNY-Stony Brook به جای خود منتقل کرده است. این یادداشت ها برای درک شهود نحوه کاهش عدم قطعیت توسط فیلترهای کالمن بسیار مفید است:

این فرایند ترکیب پویایی سیستم با اندازه گیری حالت ، اصل اساسی فیلترهای کالمن است. فیلترهای کالمن خواص برآورد خوبی را ارائه می دهند و در موارد خاص هنگامی که فرایند و اندازه گیری از توزیع گاوسی پیروی می کنند ، بهینه هستند. >

Milutin توضیحات واضح و کاملی از خط لوله خود برای تشخیص وسایل نقلیه با استفاده از HOG و Linear SVM ارائه می دهد:

"اهداف/مراحل این پروژه به شرح زیر است: استخراج ویژگی های مورد استفاده برای طبقه بندی طبقه بندی ایجاد و آموزش پنجره را بکشید و خودرو را بر روی یک تصویر مشخص کنید > فیلترهای مثبت کاذب < bq> محاسبه فاصله اجرای خط لوله در ویدئو "

تشخیص و ردیابی خودرو با استفاده از دید کامپیوتر

آرنالدو گونزی

توضیح شهودی که آرنالدو برای هیستوگرام گرادیان های جهت دار ارائه می دهد را دوست دارم ( الگوریتم HOG):

"استخراج کننده HOG قلب مت است در اینجا شرح داده شده است این راهی برای استخراج ویژگی های معنی دار یک تصویر است. این "جنبه عمومی" خودروها را نشان می دهد ، نه "جزئیات خاص" آن. این همان چیزی است که ما ، انسان ها ، انجام می دهیم: در نگاه اول ، ماشین را پیدا می کنیم ، نه مارک ، صفحه ، چرخ ، یا سایر جزئیات کوچک. HOG مخفف "Histogram of Oriented" است. گرادیان ”. اساساً ، یک تصویر را در چند قسمت تقسیم می کند. برای هر قطعه ، گرادیان تنوع در تعداد مشخصی از جهت ها را محاسبه می کند. "

ماشین خودران اسباب بازی

Srikanth Pagadala

من مینی خودرو خودران را دوست دارم که شرک ساخته است ، و به ویژه من دوست دارم که او یک شبکه عصبی عمیق را آموزش دهد تا ماشین به علائم راهنمایی و رانندگی واکنش نشان دهد!

"driver.py - قلب پروژه است. این شامل خط لوله پردازش تصویر است که با استفاده از DNN که قبلاً آموزش دیده است علامت ترافیک را از دوربین شناسایی کرده و سپس سیگنال های کنترل رانندگی مناسب را به خودرو ارسال می کند. "

Advanced Lane Lines - Challenge Videos Try

آلنا کاستسیوکاوتس

آلنا فراتر از حداقل الزامات برای پروژه پیدا کردن خط پیشرفته ، و خط لوله بینایی رایانه ای خود را برای کار بر روی فیلم چالش برانگیخت:

"وقتی اولین بار خط با موفقیت شناسایی شد ، من از معادله خط با حاشیه به عنوان منطقه برای جستجوی خط بعدی استفاده می کنم. دیگر نیازی به انجام جستجوی پنجره کشویی نیست. "

ادغام با هوش مصنوعی: چگونه مغز بسازیم -رابط رایانه ای برای ارتباط با Google با استفاده از Keras و OpenBCI

ادغام با هوش مصنوعی: چگونه مغز بسازیم -رابط رایانه ای برای ارتباط با Google با استفاده از Keras و OpenBCI

ایلان ماسک و Neuralink می خواهند یک رابط مغز و رایانه بسازند که بتواند به عنوان لایه سوم مغز عمل کند و به انسان این امکان را بدهد که با Artificial ارتباط همزیستی برقرار کند. هوش.

اما اگر می توانید این کار را انجام دهید؟

در یک شکل (بسیار) محدود ، در واقع می توانید.

سابقه

< p> رابط مغز و رایانه (BCI) به طور گسترده به هر سیستمی اطلاق می شود که ارتباط مستقیمی بین سیستم عصبی و یک دستگاه الکترونیکی برقرار کند. این دستگاه ها ممکن است با جراحی در مغز کاشته شوند یا خارجی باشند. پارادایم های معمولی شامل اجازه دادن به کاربر برای کنترل یک محرک یا صفحه کلید ، اجازه دادن به یک دستگاه برای ارسال داده های حسی به کاربر ، یا ارتباط دو طرفه شامل داده های حسی و کنترل حرکتی (یعنی بازوی مصنوعی که ورودی کنترل موتور را دریافت می کند و داده های حسی را برای فشار ارسال می کند) یا درجه حرارت)

از نظر تاریخی ، پروتزهای عصبی انگیزه اصلی تحقیقات BCI بوده است. این شامل اندام مصنوعی برای افراد قطع عضو ، کاشت حلزون شنوایی برای ناشنوایان و تحریک عمیق مغزی برای افرادی است که از تشنج رنج می برند. در حال حاضر ، این دستگاه ها زندگی میلیون ها نفر را بهبود بخشیده است و استفاده گسترده از آنها مزایای دستیابی به ارتباط مستقیم دو طرفه بین مغز و دستگاه های الکترونیکی را نشان می دهد. با این حال ، کاربردهای احتمالی این فناوری بسیار فراتر از مراقبت های بهداشتی است. حتی در حوزه پروتزهای عصبی ، ما می توانیم فراتر از ترمیم تصور کنیم و به افزایش توانایی های خود فراتر از سطوح طبیعی انسان فکر کنیم. اعضای مصنوعی ممکن است روزی به حدی پیشرفت کنند که با هر معیار عینی از همتایان طبیعی خود برتر باشند. این اندام ها ممکن است شبیه اندام های معمولی به نظر برسند ، اما بسیار قوی تر و چابک تر هستند. مثال دیگر می تواند چشم مصنوعی باشد که وضوح بسیار بیشتری نسبت به چشم انسان دارد ، توانایی بزرگنمایی یا کوچک نمایی و مشاهده در طیف UV یا IR را دارد.

با توجه به شناخت ، امکانات حتی جالب تر می شوند. و شکل گیری مهارت یک مطالعه اخیر نشان می دهد که تحریک قسمت های خاصی از مغز باعث بهبود حافظه و به یاد آوردن آن می شود. آزمایش های دیگر موفق شده اند به طور مصنوعی خاطرات را در حیوانات کاشته باشند. به عنوان مثال ، ممکن است بتوان از روشهای این مطالعات برای افزایش توانایی یادگیری سریع یک ابزار استفاده کرد. یا شاید بتوان محرک های عصبی و حسگرهای مختلف را برای ایجاد "واحد پردازش حسابی" ترکیب کرد که بتواند تشخیص دهد که مناطق خاصی از مغز مرتبط با استدلال ریاضی یا منطقی فعال شده و با آنها ارتباط برقرار می کند.

این گسترش این تقویت شناختی است که ایلان ماسک و Neuralink می خواهند دنبال کنند. به گفته ماسک و بسیاری از نظریه پردازان برجسته هوش مصنوعی ، یک مانع کلیدی در پیشرفت فکری بشری نسبت به هوش مصنوعی ، مشکل پهنای باند است: اگرچه رایانه ها و هوش مصنوعی در حال پردازش و تولید دانش سریعتر و بیشتر هستند ، اما ما با محدودیت های فوری و اساسی در توانایی خود روبرو هستیم. برای انجام همین کار ما اطلاعات را در درجه اول از طریق حواس و توانایی تفسیر زبان به دست می آوریم. در زمانی که خواندن و فهمیدن آن به چشم ها و قشر بینایی شما نیاز داردیک جمله واحد ، رایانه می تواند هزاران صفحه متن را اسکن کند. می توان تصور کرد که در چند دهه آینده ، ما ممکن است هوش مصنوعی پیشرفته ای داشته باشیم که روی سخت افزارهای تخصصی نورومورفیک کار می کند ، با مدل های فوق العاده دقیق نحوه کار جهان و توانایی تجزیه و تحلیل و درک میلیون ها سند در عرض چند دقیقه ، تصمیم گیری و استنباط هایی که بسیار فراتر از انسان است. درک مطلب. در جهانی که به طور فزاینده ای به تصمیم گیری های مبتنی بر هوش مصنوعی وابسته است ، ممکن است انسانها در تمام بخشهای تصمیم گیری تجاری ، علمی و سیاسی منسوخ شوند. مغز ما برای بازی شطرنج با تریلیون ها مهره یا درک استراتژی های محاسبه شده که میلیون ها حرکت پیش رو را برنامه ریزی می کند ، تکامل نیافته است. این ترس از این جعبه سیاه فوق العاده است که انگیزه بسیاری از کارهای فعلی در Neuralink ، Kernel و چندین سازمان مرتبط دیگر را ایجاد می کند.

بیشتر تحقیقات پیشرو در فناوری BCI به دنبال به حداکثر رساندن اطلاعات هستند پهنای باند ، معمولاً از طریق روشهای تهاجمی که الکترودها را مستقیماً در مغز یا اعصاب کاشته می شود. با این حال ، روشهای غیر تهاجمی ، به ویژه الکتروانسفالوگرافی (EEG) و الکترومیوگرافی (EMG) به طور معمول با موفقیت قابل توجهی استفاده می شود. اینها شامل قرار دادن الکترودهایی روی سطح سر (EEG) یا پوست بالای عضلات (EMG) برای اندازه گیری فعالیت الکتریکی تجمع یافته در زیر است. جزئیات این داده ها پایین است و فاصله زیادی با سطح دقت و پهنای باند دارد که در نهایت برای تحقق اهداف بلندپروازانه تحقیقات BCI مورد نیاز است. با این وجود ، BCI های دارای EEG/EMG به موفقیت های باورنکردنی مانند کنترل هواپیماهای بدون سرنشین ، بازی های ویدئویی و صفحه کلیدها با فکر دست یافته اند ، و آنها نگاه کوچکی به امکاناتی که تحقیقات بیشتر ممکن است باز کند ، ارائه می دهند. علاوه بر این ، چندین شرکت مانند Cognixion و Neurable در حال بررسی برنامه های کاربردی BCI های مبتنی بر EEG هستند و با پروژه های هیجان انگیز زیادی که در دست انجام است ، بودجه و پشتیبانی قابل توجهی دریافت کرده اند.

مرور کلی

در این پروژه ، ما یک ارتباط مستقیم بین سیستم عصبی خود و یک عامل هوش مصنوعی خارجی ایجاد کنید. این نماینده ممکن است هر چیزی باشد که بتوانید برای آن یک API دریافت کنید: Google Assistant ، Siri ، Alexa ، Watson ، و غیره. خدمات مانند دیکشنری یا YouTube نیز واجد شرایط هستند ، اما اینها برنامه ها را به درخواستهای محتوا محدود می کند تا درخواستهای عمومی.

برای اهداف این پروژه ، ما مستقیماً از جستجوی Google پرس و جو می کنیم زیرا بیشترین انعطاف پذیری را دارد و راحت ترین راه برای تنظیم است. پس از اتمام ، شما باید بتوانید تعداد کمی از اصطلاحات را در Google به سادگی در مورد آنها جستجو کنید.

تکنیکی که ما استفاده می کنیم از سیگنال های عصبی ایجاد شده توسط مغز شما در فرایند فراخطی استفاده می کند. این "مونولوگ داخلی" است که هنگامی که به آرامی و عمداً می خوانید یا فکر می کنید در داخل سر شما اتفاق می افتد. ممکن است متوجه شده باشید که هنگام سکوت خواندن این کار را انجام می دهید ، گاهی اوقات تا جایی که فک و زبان خود را با ظرافت حرکت می دهید بدون اینکه حتی متوجه شوید. همچنین ممکن است هنگام دریافت نکات مربوط به SAT ، MCAT ، GRE یا سایر آمادگی های استاندارد استاندارد با این مفهوم برخورد کرده باشید. به داوطلبان آزمون توصیه می شود از فراخوانی خودداری کنند زیرا این یک عادت بد است که سرعت خواندن را کند می کند.زیرا مغز سیگنال هایی را به حنجره شما ارسال می کند که مربوط به کلماتی است که شما فکر می کنید ، حتی اگر قصد ندارید آنها را با صدای بلند بیان کنید. با قرار دادن الکترودهایی روی صورت بر روی اعصاب حنجره و فک پایین ، می توانیم سیگنال های مربوط به کلمات خاص را ضبط کرده و از آنها برای آموزش مدلهای یادگیری عمیق که بین کلمات مختلف تشخیص می دهند استفاده کنیم. به عبارت دیگر (بدون استفاده از کلمات کلیدی) ، ما می توانیم تشخیص دهیم که شما در مورد یک کلمه خاص به سادگی از عملکرد آن فکر می کنید.

مغز و اعصاب حنجره

این فناوری محدودیت هایی دارد و به هیچ وجه مناسب یا آماده استفاده عملی نیست. با این حال ، از اولین تظاهرات خود در دنیای واقعی دو سال پیش توسط MIT Media Lab ، با موفقیت در دستگاه هایی استفاده می شود که به کاربران امکان می دهد در هنگام بازی شطرنج ریاضیات ، تماس های تلفنی ، سفارش پیتزا و حتی دریافت کمک را انجام دهند.

هدست آزمایشگاهی MIT Media AlterEgo

SETUP & MATERIALS

< p> ابزار سخت افزاری اولیه مورد نیاز یک برد OpenBCI Ganglion است. گزینه های سخت افزاری دیگری نیز وجود دارد ، اما من OpenBCI را به عنوان یکی از بزرگترین انجمن های توسعه دهندگان برای پشتیبانی یافتم. قیمت شما حدود 200 دلار است ، اما با توجه به چیزهای باورنکردنی که می توانید با آن بسازید ، ارزشش را دارد.

برد و الکترود OpenBCI

علاوه بر برد ، به الکترودها و سیم ها نیز نیاز دارید. مجموعه ای از الکترودهای فنجان طلا و ژل الکترود باید 50 دلار هزینه داشته باشد و خوب کار کند. متناوبا ، می توانید یک کیت استارت OpenBCI کامل ، که شامل برد و چند نوع الکترود خشک و همچنین یک هدبند الکترود است ، به قیمت 465 دلار تهیه کنید. این کمی گران است ، بنابراین تنظیم جام طلا کاملاً خوب است. با این حال ، اگر قصد دارید با سایر کاربردهای BCI ، مانند VR (آموزش استفاده از Unity VR به زودی!) آزمایش کنید ، هدبند و الکترودهای خشک تجربه بسیار بهتری را ایجاد می کنند.

Biosensing Starter Kit

OpenBCI همچنین تخته 8 و 16 کانال را ارائه می دهد. اینها کیفیت داده بالاتری را ارائه می دهند ، اما 4 کانال Ganglion برای این پروژه مناسب است. ترمینال خود را باز کنید و دستور زیر را تایپ کنید:

 python3 --version 

اگر پایتون ندارید یا نسخه قدیمی تری دارید ، وارد کنید: pre> $ sudo apt-get update $ sudo apt-get install python3.6

اکنون ، فهرست pyOpenBCI را بارگیری یا کلون کنید.

فهرست را به مخزن تغییر دهید و دستور زیر را برای نصب بسته های پیش نیاز اجرا کنید: < /p>

 $ pip install numpy pyserial bitstring xmltodict request bluepy 

اکنون آماده نصب pyOpenBCI

 $ pip install pyOpenBCI 

برای مشاهده هستید برخی از اقدامات ، تغییر دایرکتوری به pyOpenBCI/Examples و یافتن print_raw_example.py. این فایل را با ویرایشگر کد مورد علاقه خود باز کنید و تغییرات زیر را در خط 7 ایجاد کنید:

 board = OpenBCICyton (daisy = False) 

باید به:

<تغییر کرد pre> board = OpenBCIGanglion (mac = '*')

این به pyOpenBCI اجازه می دهد تا ماژول های مناسبی را برای برد خاصی که ما استفاده می کنیم بکار گیرد.

اکنون ، برد خود را روشن کنید. < /p>

در رایانه خود ، از فهرست Examples در ترمینال ، دستور زیر را تایپ کنید:

 $ sudo python print_raw_example 

بوم !! اکنون ترمینال شما باید با جریان داده های ورودی خام از روی صفحه پر شود.

ثبت سیگنال

اکنون که می توانیم سیگنال های خام را بدست آوریم ، می توانیم شروع کنیمطراحی و ساخت خط لوله داده برای شروع ، ابتدا باید داده های خام را به جریان LSL تبدیل کنیم. LSL به لایه Streaming Stream اشاره دارد و یک پروتکل است که در مرکز Swartz برای علوم اعصاب محاسباتی در UC San Diego توسعه یافته است تا ضبط و تجزیه و تحلیل جریان داده های زنده را تسهیل کند. LSL داده های EEG ما را بر روی میزبان محلی پخش می کند ، جایی که می توان آن را توسط برنامه های دیگر یا اسکریپت ها دریافت کرد.

تغییر فایل lsl_example.py در pyOpenBCI/Examples برای حذف جریان AUX ، که ما این کار را انجام می دهیم. نیازی نیست ، یک جریان نشانگر اضافه کنید:

ما اکنون باید یک مجموعه آزمایشی تعریف کنیم که داده ها را در فرم مورد نظر ما ضبط کرده و برای استفاده بیشتر ذخیره کند. ما می خواهیم آزمایش مجموعه ای از داده های سری EEG سری زمانی را که در فواصل جدا شده تولید می شود ، ایجاد کند که هر فاصله مربوط به زیر صداگذاری یک کلمه است. برای دستیابی به این هدف ، می توانیم آزمایشی را اجرا کنیم که یک جلسه ضبط با فواصل N را شروع می کند و هر فاصله T ثانیه طول می کشد. همه نمونه ها در یک بازه زمانی مشخص شده با شاخص فاصله و کلمه خاصی که به کاربر دستور داده می شود تا زیر صدا را بیان کند ، ذکر می شود.

فایل lsl-record.py از neurotech-berkeley به عنوان یک نقطه شروع خوب عمل می کند. مطابق با تنظیمات تعریف شده ما فایل را اصلاح کنید:

شما می توانید اصطلاح BankBank (خط 64) را برای آزمایش ترکیب های مختلف کلمات در زمینه های مختلف تنظیم کنید. همچنین می توانید مدت زمان پیش فرض (خط 12) را قبل از هر جلسه تنظیم کنید.

اکنون زمان قسمت سرگرم کننده است! الکترودها را به برد خود وصل کنید:

4 کانال چپ EEG ، راست 2 است کانال ها به حالت اولیه هستند

آنها را با تنظیمات زیر روی صورت خود بچسبانید:

یک مکان آرام برای نشستن پیدا کنید و خطوط زیر را در پایانه های جداگانه وارد کنید:

 //ترمینال 1: داده های خام را به LSL تبدیل کرده و آنها را پخش می کند
$ sudo python lsl_example 
 //ترمینال 2: جریان داده LSL را می خواند و آزمایش را اجرا می کند
$ sudo python lsl_record 

توجه: ما به عنوان sudo اجرا می کنیم تا اسکریپت بتواند آدرس MAC صفحه را تشخیص دهد

این باید یک جلسه ضبط با مدت زمان مشخص را آغاز کند. با یک کلمه تصادفی از بانک اصطلاح از شما خواسته می شود تا در فاصله های 2 ثانیه ای صدای ضعیفی را بیان کنید. جلسات ضبط ممکن است ناراحت کننده و خواب آور باشد ، بنابراین بهتر است چندین جلسه کوچک با وقفه بین آنها انجام دهید. علاوه بر این ، در صورت بروز اختلالات مکرر (به عنوان مثال حرکات ناگهانی یا کم صدا کردن کلمه نادرست) ، تنظیم تجربی ما ممکن است منجر به کیفیت داده های ضعیف شود.

شما می توانید یک تنظیم انعطاف پذیرتر با گزینه ای برای ضربه زدن به کلید طراحی و اجرا کنید. فواصل فعلی و قبلی را با مشاهده مزاحمت حذف می کند. راه حل دیگر این است که چندین جلسه کوچک انجام دهید و داده ها را در پایان ترکیب کنید ، جلسات را با اختلالات بیش از حد کنار بگذارید. برخی از سر و صدا اجتناب ناپذیر است ، و نیازی نیست که زیاد انتخابی باشید زیرا مدل با افزایش تعداد نمونه ها انعطاف پذیرتر می شود.

برای نتایج مطلوب ، باید حداقل 1000 نمونه با کیفیت بالا برای هر کلمه در بانک کلمات شما. مناسب است تا داشته باشدقالب زیر: شاخص ها از 1 تا NumIntervals ، که مجموع SessionDuration/2 بر تعداد کل جلسات است شرایط مربوط به کلمه نمایش داده شده در هر فاصله [A ، B ، C ، D] کانال های EEG هر کلمه ، ترکیب اصطلاح مربوط به تقریباً 800 خط داده است

فایل های CSV خود را با استفاده از numpy به پایتون وارد کنید. شما باید تمام داده های خود را در Numray خط 6 x ndarray در اسکریپت خود بارگذاری کنید.

اولین قدم فیلتر کردن داده ها برای حذف نویز خارج از فرکانس های مورد علاقه ما است. به نوارهای زیر: برای فرکانسهای بین 4 هرتز تا 100 هرتز ممکن است منطقی به نظر برسد ، اما با شکست مواجه می شود زیرا 60 هرتز فرکانس شبکه برق است (ممکن است بر اساس کشور متفاوت باشد) ، که احتمالاً منبع قابل توجهی از نویز است. برای نتایج مطلوب ، باید بین 4 هرتز تا 50 هرتز فیلتر کنیم.

ما می توانیم از فیلتر Scipy's Butterworth برای انتخاب محدوده فرکانسی که می خواهیم حفظ کنیم استفاده کنیم. یک فیلتر با کد زیر تعریف کنید:

سپس ، یک ستون زمانبندی ایجاد کنید (همانطور که ما مجموعه داده های متعددی را ترکیب کرده و نشانهای زمانی اصلی را نامعتبر کرده ایم) و فیلتر را در هر کانال اعمال کنید:

پس از فیلتر شدن ، از کد زیر برای بازسازی داده های خود در یک آرایه سه بعدی ndarrray با ابعاد IntervalLength x ChannelCount x IntervalCount استفاده کنید.

آنچه ما با کد فوق به طور م doneثر انجام داده ایم ، تبدیل داده های سری زمانی به داده های تصویر است به ممکن است کمی عجیب به نظر برسد ، اما می توانید هر 2 ثانیه را به عنوان یک تصویر در نظر بگیرید ، هر پیکسل مربوط به مقدار سیگنال به دست آمده در مختصات خاص (channelNumber ، lineNumber) است. به عبارت دیگر ، ما مجموعه ای از تصاویر IntervalCount داریم که اندازه هر یک از آنها IntervalLength x CannelCount است.

اولین 120 نقطه داده در فاصله EEG

این تکنیک ، که توسط جاستین الوی در پروژه ای مشابه نشان داده شد ، فوق العاده قدرتمند است زیرا به ما اجازه می دهد داده های سری زمانی را طوری درمان کنیم که گویی داده های تصویری بودند که به ما اجازه می داد از قدرت بینایی رایانه و شبکه های عصبی کانولوشنال (CNN) استفاده کنیم. شما حتی می توانید یک فرعی خاص را با ترسیم آن به صورت تصویر تجسم کنید. تعیین فرکانس هایی که باید به دنبال آن باشد.

اکنون ما آماده شروع ساخت CNN هستیم. از آنجا که ما فقط 1 بعد رنگ داریم ، می توانیم از یک CNN 1 بعدی با ابعاد ورودی IntervalLength و ChannelCount استفاده کنیم. ممکن است با پارامترها و معماری های مختلف آزمایش کنید. من بر روی یک لایه متحرک تک ، دو لایه کاملاً متصل و دو لایه جمع کننده مستقر شدم.

برای تجزیه و تحلیل دقیق تر CNN های تک بعدی و نحوه کاربرد آنها در داده های سری زمانی ، به این مقاله توسط نیلس مراجعه کنید. آکرمن.

ما در حال حاضر مدلی داریم که باید بتواند فاصله ای از داده های EEG را با یک کلمه خاص در بانک کلمات شما مطابقت دهد.

بیایید ببینیم که چقدر خوب عمل می کند. مدل را روی داده های آزمایش اعمال کنید و نتایج پیش بینی شده را با نتایج واقعی مقایسه کنید.

# مدل آزمایش
y_preditted = model.predict (X_test) 

بادو کلمه در عبارت بانک ، من توانستم به 90 درصد دقت دست پیدا کنم. همانطور که انتظار می رفت ، دقت با کلمات اضافی کمی کاهش یافت ، با 86٪ برای سه راه و 81٪ برای چهار جهت.

نمونه نمودار حقیقت از طبقه بندی دو کلمه ای. چپ واقعی است ، راست پیش بینی شده است > pp یک راه ممکن برای افزایش اندازه اصطلاح بانک بدون به خطر انداختن دقت ، ایجاد یک "اصطلاح درخت" سلسله مراتبی با پرس و جوهای چند کلمه ای است. سپس می توانید ابتدا جستجوی عمقی را روی درخت انجام دهید - هر لایه کلمات فقط با لایه های مشابه در زیر درخت مشابه با دیگران مقایسه می شود - تا بهترین مطابقت را پیدا کنید.

GOOGLE SEARCH

< p> ما در حال حاضر تمام قطعات لازم برای پرس و جو از Google با استفاده از BCI شما را داریم. یک نگاشت بین فرعی و درخواستهای خاص تعریف کنید و تماس مناسب را انجام دهید:

و….

برای انجام درخواستهای زنده همانطور که فکر می کنید ، اسکریپت lsl_record.py را به عنوان یک ماژول اصلاح و وارد کنید. سپس می توانید آن را برای خواندن جریان LSL در پاسخ به ورودی کاربر برای یک فاصله 2 ثانیه ای صدا کنید.

همین! اکنون می توانید بدون گفتن یا تایپ یک کلمه در گوگل جستجو کنید.

نتیجه گیری

با یک بانک اصطلاح سه یا چهار کلمه ای نمی توانید کارهای زیادی انجام دهید (مانع اجرای اصطلاح -درختی که قبلاً ذکر شد). گذراندن همه این مراحل برای جستجوی مسیرها به نزدیکترین پمپ بنزین کمی پیچیده تر از جستجوی گوگل در حالت عادی است. با این وجود ، مهم است که در نظر بگیریم که پیشرفت های بیشتر در این فناوری به کجا می تواند منجر شود. ما می توانیم یک نسخه بهبودیافته و کمتر آشکار از این دستگاه را تصور کنیم ، نه چندان متفاوت از آنچه تیم MIT قبلاً داشته است ، که برای ناوبری ، جستجوهای وب ، پیام های متنی ، مدیریت خانه هوشمند یا هر تعداد کارهای معمول استفاده می شود. وقتی با قدرت بهبود دستیارهای هوش مصنوعی که قادر به تفسیر وابسته به زمینه هستند ، ترکیب شود ، امکانات حتی بیشتر گسترش می یابد. تحقیقات در حال انجام در شرکت ها و آزمایشگاه های دانشگاه در سراسر جهان است. ارتباطات تله پاتی ، هوش مافوق بشری ، حواس اضافی ، تجربیات شبیه سازی شده ، دیجیتالی شدن آگاهی انسان و ادغام با هوش مصنوعی همگی قابل تامل هستند. در صورت تحقق این امکانات ، آنها فقط ارتباط ما با فناوری را دوباره تعریف نمی کنند: آنها معنای انسان بودن را دوباره تعریف می کنند.

منابع

موارد زیر لیستی از منابع است و سازمانهایی که در تکمیل این پروژه و به طور کلی در یادگیری BCI مفید بودم. من می خواهم به ویژه از تیم AlterEgo در آزمایشگاه رسانه ای MIT به عنوان الهام بخش اصلی این پروژه و همچنین آقای آلوی و NeuroTech Berkeley برای کد قبلی و کمک های آموزشی آنها در جامعه BCI قدردانی کنم. علاوه بر این ، می خواهم از استادان دانشگاه کالیفرنیا ، دیویس ، به ویژه دکتر ایلیاس تاگکوپولوس ، دکتر کارن موکسون و دکتر ارکین سکر ، برای کمک و پشتیبانی مداوم تشکر کنم.

AlterEgo: رابط گفتاری خاموش پوشیدنی شخصی پوشیده استفاده از یادگیری عمیق "افکار خود را بخوانید"-با Keras و EEG-Justin Alvey Neurotech Berkeley Github Open BCI Gitub رابط مغز و رایانه: مقدمه-Rajesh Rao

سرانجام ، من می خواهم فریاد بزرگی به صدا در آورمجوامع رو به رشد BCI/Neurotech که حمایت ، منابع و اشتیاق بی پایان برای آینده ارائه کرده اند.

NeuroTechX Reddit BCI Reddit Neuralink < uli> OpenBCI

اگر مایل به بحث بیشتر یا ارتباط هستید ، لطفاً با LinkedIn

تماس بگیرید.

چرا دید رایانه ای پیگیری جریان مردم بازار بزرگی خواهد بود

چرا دید رایانه ای پیگیری جریان مردم بازار بزرگی خواهد بود

ردیابی لیزری با چگالی در بالای در ورودی

همانطور که قبلاً نوشتم معتقدم که Computer Vision به عنوان یک رابط انسان و کامپیوتر به عامل اصلی تبدیل می شود (1) زیرا حسگرها و دوربین ها به ما در درک دنیای فیزیکی کمک می کنند.

در مورد "اینترنت اشیا" مطالب زیادی در رسانه ها وجود دارد که معنای آن را از دست داده است و به دلایل عجیبی بسیاری از آنها به عنوان یک دست کوتاه برای پوشیدنی ها شناخته می شود. پوشیدنی ها به وضوح یک بازار مهم هستند ، اما برای من یک مورد کاربرد گسترده تر این است که اشیاء واقعی را وارد دنیای محاسبات کنیم و مکانیزمی بهتر از Computer Vision وجود ندارد.

به همین دلیل امروز من بسیار هیجان زده هستم سرانجام می توانم در مورد Density ، شرکتی که من 4 میلیون دلار (2) تأمین مالی کردم به همراه Jason Calacanis (ما در هیئت مدیره با هم همکاری می کنیم! همکاری و کار در جهت این هدف مشترک بسیار عالی بود) و با جاناتان تریست در Ludlow Ventures ، آمیت کاپور در Dawn Patrol و چند نفر دیگر.

همانطور که می توانید از تصویر Giphy در بالا جمع آوری کنید ، Density به طور ناشناس حرکت افراد را در حین حرکت در فضاهای کاری دنبال می کند. این یک دستگاه کوچک و زیبا است که در ورودی ها قرار دارد و "افراد ناشناس را به عنوان یک سرویس ردیابی می کند." در ابتدایی ترین حالت خود ، سوابق ساده ای از ورود و خروج از طریق درها (افرادی که به داخل و خارج حرکت می کنند) ایجاد می کند و هر حرکت به یک رکورد در پایگاه داده تبدیل می شود که می تواند در زمان واقعی قابل ردیابی باشد.

موارد اولیه استفاده این اطلاعات ساده واضح است.

شما می توانید تعداد افراد را در یک اتاق ردیابی کنید تا مطمئن شوید نگرانی های ایمنی وجود ندارد یا افراد بیمه نامه خود را نقض نمی کنند. برای اطلاع از اتاق هایی که بیشتر و در چه ساعاتی از روز استفاده می شوند ، می توانید اتاق های جلسات را در یک پردیس بزرگ ردیابی کنید. برای پیش بینی بهتر می توانید جریان افراد را در خط مترو یا قطار ردیابی کنید. فرکانس و طول قطارهای مورد نیاز در روز والدین سالمند برای پیگیری این که آیا حالشان خوب است و حتی به طور خودکار به هنگام سقوط یا در صورت عبور فرد مبتلا به آلزایمر هشدار می دهند ff-border barrier. کسب و کارها می توانند از افراد ردیابی برای نشان دادن زمان انتظار استفاده کنند ، بنابراین شما می توانید تصمیم بگیرید که آیا می خواهید فوراً گواهینامه رانندگی خود را به روز کنید یا نه و همین مشاغل می توانند از افراد ردیابی برای تصمیم گیری در مورد اوج کارکنان استفاده کنند. و غیره.

اما همانطور که ممکن است از Giphy بالا جمع آوری کنید ، مورد استفاده ساده با ظرافت محلول Density بسیار افزایش می یابد. نرم افزار و بینایی رایانه زمانی تشخیص می دهد که انسان از کنار لیزر عبور می کند و می تواند حرکات دیگر مانند باز شدن درها یا اجسام دیگر (مثلاً سگها) را فیلتر کند.

هر انسانی به شکل چند ضلعی اسیر شده است در یک لحظه دقیق در زمان همانطور که او در اتاق حرکت می کندهر حرکت کوچک به یک ردیف جدید در پایگاه داده با مختصات و توالی زمانی تبدیل می شود. بنابراین یک انسان واحد که از یک اتاق عبور می کند ، البته می تواند هزاران ردیف در یک پایگاه داده ایجاد کند و برنامه های کامپیوتری می توانند از این داده ها معنا پیدا کنند و الگوریتم های یادگیری ماشین البته می توانند تصمیمات آگاهانه ای را در مورد مواردی مانند "یافتن راه" قرار دادن علائم ، شروع کنند. جایی که خطرات جمعیت ممکن است ایجاد شود ، و غیره. به اعتقاد ما ارزان و ناشناس منجر به ایجاد یک بازار گسترده با برنامه هایی می شود که از بسیاری موارد استفاده پشتیبانی می کند. تراکم به سادگی بستر داده و تجزیه و تحلیل است. هدف ما این است که به طور گسترده هزینه های ضبط جریانات مردم را کاهش دهیم و پتانسیل نامحدودی را برای سازمانها ایجاد کنیم تا بتوانند این امر را درک کرده و بینش هایی را طراحی کنند که به برنامه ریزی بهتر فضاها کمک می کند.

البته اگر سازمانی سنسورهای تراکم را خریداری کند ، داده ها به طور گسترده تری در بازار موجود نیست مگر اینکه آنها تصمیم به اشتراک گذاری با دیگران بگیرند. استفاده اولیه از Density تنها یک سازمان خواهد بود ، اما ما فکر می کنیم به احتمال زیاد با گذشت زمان سازمان ها در شرایط محدود و کنترل شده تصمیم به اشتراک گذاری اطلاعات بین شرکت ها خواهند گرفت.

چرا تراکم؟

سرمایه گذاری این پایان نامه برای من اعتقاد من به بینایی رایانه ای را به عنوان ورودی/خروجی نسل بعدی (3) همراه با تز من مبنی بر این که معضل نوآور یا اقتصاد تورم زا ، بزرگترین موفقیت را در اینترنت ایجاد می کند (4).

امروزه راه حل های ردیابی مردم بسیار گران هستند و بیشتر در محیط های خرده فروشی استفاده می شوند. هزینه ها تا حد زیادی پذیرفته شده است و ما فکر می کنیم که این امر به طور گسترده ای تغییر خواهد کرد.

این تیم بر ناشناس ماندن اصرار داشت زیرا معتقد است دستگاههای ردیابی کم هزینه و در دسترس در دسترس نباید هویت افراد را ثبت کنند. ، که هم پذیرش را محدود می کند و هم هزینه ها را به طور چشمگیری افزایش می دهد. باید اعتقاد داشته باشم که با تیمی از بنیانگذاران بسیار درخشان ، بسیار رقابتی و بسیار پرشور ملاقات کرده ام که ایده ای برای محصولی دارند که می تواند بازار را متحول کند.

من به دنبال کسی هستم که تقریباً مأموریت برای دیدن محصول در بازار بیش از کسب درآمد سریع است و من به دنبال بنیانگری هستم که صرفه جو ، مبتکر و دارای احساس قوی نسبت به آنچه به طور منحصر به فرد در مورد اشتباهات بازار و چگونگی آن معتقد است ، باشد. می توان آن را برطرف کرد.

من همیشه به مردم می گویم مهم این است که چه کسی شما را معرفی می کند. من با دوستم جاناتان تریست در لادلو صحبت می کردم و به او گفتم که کمی وقت آزاد کرده ام و به دنبال شرکتی در مراحل اولیه هستم که از نظر فنی به عقب بازگردد. ما در سال گذشته چند معامله انجام داده بودیم ، بنابراین می خواستم بدانم که او اخیراً چه چیزی دیده است. جمع آوری سرمایه و من متنفرمملاقات با افراد دیر در یک فرایند.

از اولین ملاقاتی که من با بنیانگذار و مدیرعامل - اندرو فرح - و تیم او در گروه سیراکوز داشتم ، می دانستم که آنها بینش ، خلق و خو و انگیزه های مناسبی برای ایجاد این بازار دارند.

من گروهی از آنها را آوردم بلافاصله برای ملاقات با بقیه شرکای خود به LA رفتم. ما البته یک بحث داخلی سالم داشتیم که آیا این دستگاه از دقت کافی برخوردار است زیرا در ابتدا به مادون قرمز متکی بود و نمی توانست با دقت کافی ردیابی کند. دوربین های ویدئویی راهی بودند و تقاضای ناشناس ماندن در مقابل راه حل هایی که می توانند به امنیت /شناسایی کمک کنند.

در نهایت به این نتیجه رسیدیم که تیم های فوق العاده با استعدادی مانند Density تصمیمات درستی در زمینه طراحی محصول می گیرند و ما نباید محصولات امروزی را در برابر قابلیت های تیم برای انتخاب محصول مناسب انتخاب کرد ، زیرا آنها از نمونه اولیه به محصول نهایی رسیدند.

و البته ظرف چند ماه پس از جمع آوری سرمایه ، تیم طراحی محصول را کامل کرد و از مادون قرمز به سمت لیزر دور شد و کارایی ، جمع آوری داده ها و دقت را در حالی که هزینه ها ثابت نگه داشته شد ، بهبود بخشید. t دریافت کنید بیش از حد به مشخصات دقیق محصول امروز متصل شده اید - شما بیشتر به دنبال این هستید که چگونه آنها انتخابهای طراحی خود را تا به امروز انجام داده اند ، چه گزینه های دیگری را در نظر گرفته اند و چگونه به نتایج اولیه خود رسیده اند. شما همچنین انعطاف پذیری ذهنی آنها را در نظر گرفتن راه حل های جایگزین آزمایش می کنید تا بدانید در نهایت آنها بر اساس داده هایی که در سفر خود جمع آوری می کنند با بالاترین کیفیت تصمیم گیری می کنند.

من نمی توانم به این اندازه تأکید کنم - سرانجام سرمایه گذاران برای تصمیم گیری های سخت باید به تیم های موسس اعتماد کنند زیرا تیم روز به روز در سنگر زندگی می کند و سرمایه گذاران می توانند خود را فریب دهند که فکر می کنند از طریق شهود یا ملاقات با 10 شرکت در یک فضا ، پاسخ درست را می دانند. هیچ چیز تیم را بر زمین نمی زند و اگر به آنها در برقراری تماس های سخت اعتماد ندارید - پس آنها را پشت سر نگذارید. نقش ما شریک نبرد است. وظیفه ما این است که مطمئن شویم تیم شما سخت ترین سالات را از خود می پرسد. در نهایت ، رای با شما است.

چه تراکم بعدی؟

امروز ما به طور رسمی اعلام می کنیم که محصول در دسترس اولین شرکت ها و توسعه دهندگانی است که آن را سفارش می دهند (ما محدودیت داریم موجودی) و به طور کلی در سه ماهه اول سال آینده در دسترس خواهد بود. این یک محصول مصرفی نیست - برای افرادی با قابلیت های فنی است. ما آن را در بتا خصوصی در 6 ماه گذشته با شرکت هایی مانند Uber ، با دانشگاه های بزرگ ، با یک شرکت هواپیمایی بزرگ و بسیاری از شرکت های دیگر داشته ایم.

یک ویدیوی کلی 1 دقیقه ای عالی در اینجا وجود دارد و در زیر تعبیه شده است. :

اگر می خواهید مشارکت داشته باشید یا فقط علاقه مند به یادگیری بیشتر هستید ، لطفاً از وب سایت Density دیدن کنید.

ضمیمه

(رسانه هنوز اینطور نیست به من اجازه دهید پیوندهایی در داستان داشته باشم که زبانه های جدیدی باز کند ، بنابراین اکثر پیوندهای خود را به عنوان ضمیمه قرار می دهم تا حواس خواننده را پرت نکنم.با کلیک کردن روی داستان اصلی)

بینایی رایانه ای به عنوان یک موضوع اصلی سرمایه گذاری برای سرمایه گذاری های پیشرو از جمله Nanit ، Osmo ، Navdy ، GumGum و Density. Density 4 میلیون دلار از Upfront Ventures جمع آوری می کند ، Ludlow ، Dawn Patrol ، Jason Calacanis و موارد دیگر. من این ویدیوی بسیار کوتاه را در Snapstorms.com (در حال حاضر بر اساس دسته بندی توصیه های کارآفرین قابل جستجو است) انجام دادم ، اگر علاقه مند به شنیدن نظرات سریع در مورد Computer Vision هستید I/O برای آینده محاسبات (یا فقط می توانید از جاسازی زیر تماشا کنید)

3. معضل مبتکران و اقتصاد تورمی و نحوه راه اندازی آنها در استارتاپ ها.

4. چگونه سرمایه گذاری کنم؟

کنترل دستگاه نیمه اتوماتیک فرز با جفت آردوینو نانو

کنترل دستگاه نیمه اتوماتیک فرز با جفت آردوینو نانو

نوع ماشین آلات CNC که عموماً در گاراژها و فضاهای سازنده پیدا می کنید ، از موتورهای پله ای برای قرار دادن ابزار برش نسبت به قطعه کار استفاده می کنند. این به طور معمول با رایانه یا راه اندازی Arduino کنترل می شود ، که حرکات را در مسیری از پیش برنامه ریزی شده ایجاد می کند. معمولاً این کار خوب انجام می شود ؛ با این حال ، YouTuber Electronoobs تصمیم گرفت نوعی ماشین نیمه اتوماتیک بسازد که در آن حرکت هنوز توسط موتورهای پله ای کنترل می شود ، اما در عوض توسط یک سری دکمه ها به صورت دستی فعال می شود.

پیکربندی او از Arduino Nano و یک جفت تخته درایور استپر A4988 برای تولید پالس مناسب استفاده می کند ، در حالی که نانو دوم پیگیری می کند چرخش موتور و نمایش داده های فاصله از طریق صفحه LCD. در حالی که-در ابتدا-به نظر می رسد یک راه حل عجیب است ، در حدود 2 دلار برای تخته دوم ، در واقع یک راه بسیار مقرون به صرفه برای پیگیری همه چیز است.

در مورد اینکه چرا شخص می خواهد این نوع کنترل را داشته باشد ، می تواند یک گام عالی برای یادگیری نحوه کار دستگاه CNC باشد کار می کند ، یا برای کنترل دیگر اختراعات با حرکت پله ای. همچنین می توان از دستگاهی استفاده کرد که عملکرد پیشرفته تری در این نوع ماشین ها اعمال می کند ، مانند تراشیدن منحنی ها در قطرهای از پیش تعریف شده و سایر توابع که توانایی دستگاه "دستی" را افزایش می دهد.