هوش مصنوعی در سال های اخیر در حوزه های مختلفی نفوذ کرده و توانسته روند انجام بسیاری از پژوهش ها و تحقزقات را در حوزه های مختلف تسریع و تقویت کند. یکی از حوزه هایی که هوش مصنوعی توانسته اثرگذار باشد، توسعه دارویی است به طوری که هم کیفیت و هم کمیت داده های زیستی و شیمیایی را بهبود بخشد.
در حدود ۱۰۰ سال اکتشاف دارویی، دانشمندان قریب ۷۰۰۰ درمان را برای بیماری های مختلف کشف کرده اند که از این میان تنها ۵۰۰ درمان مربوط به بیماری های نادر بوده است. این فرایند کشف دارو معمولا طولانی مدت و پرهزینه است اما هوش مصنوعی می تواند این روند را تسریع کند. این فناوری، هندسه سه بعدی و ساختار اتمی یک مولکول دارومانند را گردهم آورده و تصویری از چگونگی چسبیدن آن را به پروتئین هدف ایجاد می کند. یک سیستم هوش مصنوعی، تعاملات میان داروها و اهداف آنها را محاسبه می کند. فعل و انفعالات ناخواسته با پروتئین های غیرهدف مختلف ممکن است مولکولی امیدوارکننده را با عوارض جانبی تحت فشار قرار دهد.
دانشمندانی که در فرایند تولید داروها از فناوری هوش مصنوعی استفاده می کنند، حجم بزرگی از داده های زیستی را در آزمایشگاه های دنیا ایجاد کرده اند. عدم ثبات در روش های تجربی و چگونگی ثبت داده ها می تواند مشکلاتی را به همراه داشته باشد همان طور که سوگیری نسبت به انتشار نتایج صرفا مثبت می تواند مشکل آفرین باشد. اگرچه بعضی از افراد تصور می کنند حجم بیشتری از داده ها به خودی خود راه حلی اساسی خواهند بود، برخی دیگر معتقدند که محققان دانشگاهی صنعتی باید برای بهبود کیفیت داده هایی گردهم آیند که در اختیار مدل های یادگیری ماشینی قرار داده می شوند.
نیاز به شیوه استاندارد جمع آوری داده
استفاده آزمایشگاه های مختلف از روش ها و معرف ها و ماشین های مختلف، اختلاف هایی را در جمع آوری داده ها ایجاد کرده و همین امر، کاربرد بسیاری از پایگاه های داده عمومی را پیش از رواج هوش مصنوعی زیر سؤال می برد. برخی بر این باورند که بهترین رویکرد برای تولید داده های مرتب شده ای که هوش مصنوعی به آن نیاز دارد، وضع قوانین چگونگی اجرا و گزارش آزمایش هاست. یکی از این نمونه ها، اطلس سلول انسانی است که به عنوان یک پروژه جهانی در سال راه اندازی شد و تاکنون میلیون ها سلول را در بدن انسان به روشی دقیق و استاندارد نقشه برداری کرده است. این کار، داده های ثابتی را فراهم می کند که خوراک ایده آلی برای الگوریتم های هوش مصنوعی است که در جستجوی اهداف دارویی بالقوه هستند.
پلتفرمی برای استاندارد کردن داده ها
Polaris یک پلتفرم معیار برای کشف دارو با هدف کمک به منظم و استاندارد کردن مجموعه داده ها برای یادگیری ماشینی است. این پلتفرم بررسی های اساسی را برای مجموعه داده مشخص کرده و سازندگان باید توضیح دهند که چگونه داده ها تولید شده و مورد استفاده قرار می گیرند و باید به منابعی که از آنها استخراج کرده اند، ارجاع دهند. این هشدار می دهد که بررسی وجود داده های تکراری واضح و مبهم بر عهده سازنده است. بدون تلاش بیشتر برای تولید داده های هماهنگ و مرتبط، ادامه توسعه الگوریتم های پیشرفته تر ممکن است انرژی کمی داشته باشد. هنگامی که آن داده های خوب در دسترس هستند، می توان پیشرفت سریع و قابل توجهی در جهت درست داشت.
شناسایی ارزش نتایج منفی
محققان دانشگاهی معمولا از شکست آزمایش ها سود نمی برند. داده هایی که از کار منتشر شده گرفته شده و به الگوریتم وارد می شوند، همواره نمای انحرافی و رنگ آمیزی از چشم انداز زیستی ارائه می دهند. یکی از شیمیدانان دارویی در کالج لندن به نمونه از سوگیری ها در جستجوی آنتی بیوتیک های جدید اشاره کرده است. یک گام مهم در نابودی میکروب ها، پنهان کردن ترکیبی در داخل سلول باکتری است و بسیاری از مطالعات منتشر شده نشان می دهند که آمین های اولیه به عنوان ترکیبا کوچکی که از نظر ساختار شبیه آمونیاک هستند، در ورود داروها به داخل باکتری کمک می کنند. مدل هوش مصنوعی، برای این امر ترکیباتی حاوی آمین های اولیه را پیشنهاد می کند. همین سوگیری نسبت به اشتراک گذاری نتایج مثبت، شرکت های داروسازی را نیز متضرر می کند.
شرکت های دارویی مقادیر بالایی از داده ها از جمله نتایج منفی را نگه داشته و تلاش می کنند تا آنها را به روشی استاندارد جمع آوری کنند که هضم آن را برای مدل های هوش مصنوعی ایده آل کند. باوجوداین، تنها بخش کوچکی از این داده ها در حوزه عمومی قرار می گیرند که طبق برآوردها، شرکت های دارویی تنها حدود ۱۵ تا ۳۰ درصد از داده های خود را منتشر می کنند که برای آزمایش های بالینی تا ۵۰ درصد افزایش می یابد. ارزش داده هایی که آنها نگهداری می کنند برای خود شرکت ها از بین نمی رود. بیشتر شرکت های داروسازی از به اشتراک گذاری داده ها با دانشگاهیان و با یکدیگر بیزار هستند.
یکی از باارزش ترین مجموعه داده های موجود در اختیار محققان، بانک زیستی انگلیس است که به طور سیستماتیک اطلاعات ژنتیکی، سبک زندگی و سلامتی و نیز نمونه های زیستی را از ۵۰۰ هزار نفر در انگلیس جمع آوری کرده است. این تلاش بیش از ۶۳۲ میلیون دلار بودجه دریافت کرده است اما بیشتر از منابع دولتی و خیریه است. برخی محققان استدلال می کنند که حجم عظیم داده ها و پردازش هوشمندتر، راه طولانی را برای غلبه بر مشکلات استفاده از هوش مصنوعی برای کشف دارو انجام می دهد. ابزارهای هوش مصنوعی مدرن به محققان امکان می دهند که نوآوری را تا کمک مالی ردیابی کنند.