مجری طرح جویشگر بومی در گفتوگو با ماهنامه نسل چهارم:
سرمایه گذاری دولت در جویشگر بومی بدون حمایت مردم بی فایده است/ به دنبال راهاندازی جویشگر ملی با مالکیت دولتی نیستیم
نظر به تلاش های چندین ساله متخصصان داخلی، هماکنون دو موتور جستجوی بومی با نامهای پارسیجو و یوز در حال فعالیت هستند که به اعتقاد کارشناسان وضعیت فنی مطلوبی دارند و با مراجعه هر چه بیشتر کاربران ایرانی به جایگاه واقعی خود خواهند رسید. با توجه به اهمیت و جایگاه جویشگرهای بومی، در بخش کنکاش شماره چهارم ماهنامه نسل چهارم با نگاهی تحلیلی و کارشناسانه، با مجری طرح جویشگر بومی در پژوهشگاه ارتباطات و فناوری اطلاعات گفتوگو شده است.
به گزارش سیتنا، گفتوگوی ماهنامه نسل چهارم با دکتر علیرضا یاری، رئیس پژوهشکده فناوری اطلاعات پژوهشگاه ارتباطات و فناوری اطلاعات و مجری طرح جویشگر بومی را بخوانید.
سوال: به عنوان سؤال نخست، در خصوص لزوم طراحی موتور جستجوگر بومی توضیح فرمایید.
جواب: راهاندازی جویشگر بومی صرفاً به این علت نیست که ما بخواهیم یک خدمت یا نرمافزار را تولید کنیم و در اختیار مردم قرار دهیم. طراحی و راهاندازی این سیستم از ابعاد مختلف اقتصادی، سیاسی، فرهنگی و اجتماعی بسیار حائز اهمیت است. پس ما که به دنبال راهاندازی جویشگر بومی هستیم هدفمان این است که گردش اطلاعات و تأثیر آن بر ابعاد مختلف را تقویت کنیم. در حال حاضر حدود 40 تا 50 موتور جویشگر داخلی وجود دارند که البته برخی از آنها غیرفعال هستند. به هر حال با ابعاد کوچکی شروع شدهاند و بعضاً نتوانستهاند منابع مورد نیازشان را تأمین کنند یا به مدل کسبوکار مناسبی برسند و نهایتاً متوقفشدهاند. برخی هم فراجویشگر هستند یعنی جویشگرهای گوگل، یاهو و سایرین را استفاده میکنند و امکان جستجوی همزمان از این جویشگرها را برای کاربران فراهم میکنند؛ به عبارت دیگر خود این خدمات جویشگر نیستند و امکان سایر جویشگرها را استفاده میکنند و برای کاربران امکان جستجوی همزمان در چند جویشگر را فراهم میکنند.
در کنار این جویشگرهای موجود در کشور، دو جویشگر دیگر داریم که وزارت ارتباطات و فناوری اطلاعات از چند سال پیش به شکل پژوهشی با دانشگاههای کشور شروع کرده است. یکی از آنها یوز و دیگری پارسی جو است. لزوم راهاندازی این جویشگرها از آنجا اتفاق افتاد که جویشگرها علاوه بر ابعاد تحقیقاتی، به منابع زیاد سختافزاری نیاز دارند و این باعث میشود که بخش خصوصی نتواند به شکل قابل قبول در این بخش وارد شود و در ابتدا حمایتهای دولت مورد نیاز است. این حمایتها مشتمل بر پهنای باند، سرور و موارد مرتبط با تحقیق و پژوهش است که در این دو پروژه این موارد پوشش داده شد و در حال حاضر به مقطعی رسیده است که ما میخواهیم خدمات دیگر جویشگرها مانند ترجمه، نقشه، پست الکترونیک و شبکه اجتماعی را با اینها ترکیب کنیم و سکوی خدمات پایهای مانند گوگل را فراهم کنیم. از سوی دیگر قصد نداریم که تنها یک جویشگر بومی داشته باشیم؛ چرا که وابستگی به یک جویشگر باعث از بین رفتن رقابت شده و به کیفیت خدمات مورد انتظار کاربران نیز لطمه وارد میشود.
سوال: بفرمایید آیا نمونههای موفق دنیا در حوزه موتورهای جستجوگر نیز چند موتور جستجو را به صورت همزمان در دستور کار دارند و نحوه فعالیت این موتورها چگونه است؟
جواب: طی فراخوان ما علاوه بر دو موتور جویشگر نامبرده، از بخش خصوصی هم شرکتهایی ورود کرده که در میان آنها یک سکوی جویش هم پیشنهاد شده است که اگر شرایط فراهم شود موتور سوم نیز در کنار دو موتور قبلی مورد حمایت قرار میگیرد، ولی مسلماً هدف این نیست که تا انتها هر سه جویشگر مورد حمایت ما باشد چون در این بخش نیاز به تمرکز است و هزینه سه جویشگر بسیار بالاست. کشوری مانند امریکا نیز دو جویشگر بینگ و گوگل را دارد، که بینگ حدود 30 درصد سهم بازار کشور آمریکا را دارد. در چین نیز سه جویشگر غالب مشتمل بر دو جویشگر بومی و گوگل مشغول به فعالیت است، که دو جویشگر داخلی بیش از 80 درصد بازار را در اختیار دارند. در روسیه نیز جویشگر بومی حدود 70 درصد بازار را در اختیار دارد و گوگل 30 درصد باقیمانده را تصاحب کرده است. پس چند جویشگر داشتن بستگی به شرایط بازار آن کشور دارد. ولی نکته قابلتوجه این است که ما به دنبال ارائه خدمات گوگل نیستیم؛ چرا که پایه خدمات گوگل مبتنی بر وب است، ولی ما در جویشگرهای بومی به دنبال ارائه خدماتی هستیم که مردم کشورمان نیاز دارند و گوگل به آن نپرداخته است. به عنوان مثال فردی در خیابان امیرآباد تهران به دنبال انتخاب مدرسهای خوب است که گوگل نمیتواند پیشنهاد مناسبی به او ارائه دهد، در صورتی که موتورهای بومی میتوانند از اطلاعات داخل کشور استفاده کرده و بهترین گزینه را به شما ارائه دهند.
به هر حال توصیه ما به بخش خصوصی این است که اگر میخواهند در طرح جویشگر فعالیت کنند در حوزه خدمات ارزش افزوده وارد شوند که به دو محور محتوای بومی و حوزه منطقهای بستگی دارد و در واقع خدمات محلی بر پایه مدل مناسب کسبوکار ارائه دهند که میتواند هم برای کاربران جذاب باشد و هم درآمد اقتصادی برای جویشگرها به همراه داشته باشد.
سوال: نحوه حمایت دولت ها از موتورهای جستجوگر داخلی در کشورهای پیشرو چگونه است؟
جواب: اگر شروع گوگل را بررسی کنید شرکتهای استارت آپ کوچکی بودند. در آن زمان خیلی هنوز فرهنگ جستجو نبود و به راحتی امکان تأمین نیازهای کاربران وجود داشت؛ در واقع با رشد نیاز مردم رشد کردند و توانستند بازار را در اختیار بگیرند. حمایت دولت از این موتورها هم در ابتدا بسیار کم بود، ولی الآن از گوگل حمایت میشود، به دلیل اینکه گوگل موتور اطلاعاتی دولت است و در واقع به مدیریت اطلاعات در آمریکا کمک میکند. در اصل تبلیغات و خلق دانش دو منبع اصلی تأمین درآمد جویشگرها هستند. مدیریت دانش از ضبط گردش اطلاعات و همچنین انباشت آنها شکل میگیرد. به عنوان مثال در کدام نقطه از دنیا چه بحثی جستجو میشود و این اطلاعات با ارزش و مهم تلقی میشود؛ یا اینکه در کدام نقطه از دنیا چه پرسشهایی به عنوان پرسش اصلی مردم به شمار می رود و این اطلاعات بر اساس نیاز بخشهای مختلف ارائهشده و کسب درآمد میشود.
سوال: نحوه تعامل شرکتهای دانش بنیان با پروژههایی مانند موتور جستجوی ملی چگونه است؟
جواب: ما به دنبال راهاندازی جویشگر ملی با مالکیت دولتی نیستیم و همواره خواسته شده است که این طرح، جویشگر بومی خطاب شود نه جویشگر ملی. در این طرح سعی میشود تا شرکتهای دانش بنیان در جهت مرتفع ساختن نیازهای منابع انسانی و منابع تجهیزاتی و سرمایهای حمایت شوند. البته این حمایت را در جهتی باید هدایت کنیم تا در اختیار شرکتهای فعال و پیشرو در این حوزه قرار گیرد که بتوانند ضمن افزایش توانمندی، از سایر فعالین این بخش نیز حمایت کنند. در نهایت ما به دنبال راهاندازی جویشگرهای بومی در قالب بخش خصوصی هستیم که این مهم در قالب مشارکت شرکتهای دانش بنیان اجرایی شکل خواهد گرفت.
سوال: بفرمایید تا کنون رقم حمایت وزارت ارتباطات از موتور جستجوی بومی چه میزان بوده است؟
جواب: ما از سال 86 در دو بخش زیرمجموعه وزارت ارتباطات یعنی مرکز تحقیقات مخابرات و سازمان فناوری اطلاعات در قالب دو پروژه پژوهشی با دانشگاه یزد و دانشگاه امام حسین عقد قرارداد کردیم که قالب پروژهها بسیار کوچک بود، اما رقمی که اخیراً اعلامشده یعنی 170 میلیارد تومان، هزینهای بوده است که دولت طی 5 سال آینده در این بخش سرمایهگذاری میکند و این رقم ممکن است افزایش هم پیدا کند، اما در سال جاری حدود 20 میلیارد تومان از بودجه توسط وزارت خانه تخصیص داده شده است. هزینههای فعلی طرح در بخش تجهیزات برای جویشگرهای بومی و خدمات جانبی آنها، اجاره پهنای باند و نگهداری خدمات جویشگرهای بومی است، اما در نهایت بیشترین هزینه در این بخش در زیرساخت بوده است که خریداری سرور و تجهیز مرکز داده انجام شده است.
سوال: آیا پایهریزی برای راهاندازی و توسعه موتور جستجوی بومی بر اساس فرهنگ و نیاز کشور بوده است؟
جواب: جایی که سخن از جویشگرهای بومی است، منظور این نیست که از ابتدا کلیه ابزارهای مورد نیاز در جویشگرها طراحی و راه اندازی شوند بلکه جمعآوری اطلاعات وب فارسی، نمایهسازی و مباحث مرتبط با خط و زبان فارسی که خاص کشور ماست بیشتر اهمیت پیدا میکند. در ابتدا که ما شروع کردیم گوگل در این بخش خدمات ضعیفی ارائه میکرد و هیچگونه پردازشی روی خط و زبان فارسی انجام نمیداد حتی حروف با قلم های عربی و فارسی را تشخیص نمیداد، ولی به مرور گوگل در این حوزه سرمایهگذاری کرد و در حال حاضر در این بخش از دقت بسیار مناسبی برخوردار است. بنابراین جویشگرهای بومی نیاز به دانش روز دنیا دارند تا بتوانند با دقت و کیفیت مناسب کاربران خود را راضی نمایند. خوشبختانه در حال حاضر جویشگرهای بومی از علم روز دنیا استفاده میکنند، ضمن اینکه موضوعات مرتبط با خط و زبان نیز دارای اهمیت بوده و در جویشگرهای بومی به صورت خاص پژوهش میشود و این مستلزم نیروی بالای پژوهشی است.
سوال: در خصوص تعامل موتورهای جستجوی بومی با سایر موتورهای جستجو در دنیا توضیح بفرمایید.
جواب: ما بحث همکاری با سایر جویشگرها را در دستور کار داریم و به دنبال مدل همکاری مناسب هستیم. تجربه ما در خط و زبان فارسی طبیعتاً در شرایط بهتری از جویشگرهای خارجی است، ولی تجربه جهانی آنها بیشتر از ماست و ابزارهای آنها از ویژگیهای بهتری برخوردار است. در نهایت در این بخش میتوان همکاری مشترکی بین طرفین ایجاد کرد تا ما بتوانیم نیازهای آنها در خط و زبان فارسی را برآورده کنیم و آنها نیز در حوزه زیرساختی و پایهای به ما کمک کنند، که این مورد در کارگروه فنی در حال بررسی است که کشورهای روسیه، چین و کره در دستور کار است. در حال حاضر اکثر سهم بازار ما در اختیار گوگل است و با گوگل هم میتوانیم نمونه همکاری مناسبی تعریف کنیم، اما تا کنون صحبتی نشده است.
سوال: با توجـــه به فعالیــت جستجوگرهای فعلی که توضیح فرمودید، پیشنهاد شما به سایر فعالان حوزه موتور جستجوی بومی که علاقهمند به فعالیت در این حوزه هستند چیست؟
جواب: در طرح جویشگر با توجه به حمایتهای وزارت ارتباطات و همچنین فعالیت بخش خصوصی سرمایهگذاری اولیه در توسعه سکوی خدمات جویشگر متنی شده است و طرح برنامهای برای هزینه جدید در این حوزه ندارد؛ ضمن اینکه از سوی فعالان نیز در این حوزه پیشنهادی دریافت نشده است. همانطوری که قبلاً هم اشاره شد امکان حمایت بیش از سه جویشگر به طور همزمان فراهم نبوده و طبق برنامه طرح این حمایتها باید به تدریج در دو و نهایتاً یک جویشگر متمرکز شود. مسلماً کمبود منابع انسانی و همچنین منابع زیرساختی مهمترین دلیلی است که ما را به سمت محدود کردن حمایت از این جویشگرها و هدایت آنها به سمت اتحاد میبرد. عقیده بر این است که اگر این شرکتها با الحاق به همدیگر تبدیل به شرکت دانش بنیان بزرگی شوند، مسلماً موفق تر خواهند بود.
سوال: در خصوص جزییات موتورهای جستجوگر فعلی و سهم این موتورها در جستجوی فارسی در اینترنت توضیح فرمایید؟
جواب: به هر حال این خدمات هم اکنون روی وب در دسترس هستند و کاربران هم از داخل شبکه ملی اطلاعات و هم از شبکه اینترنت به این جویشگرها مراجعه میکنند. سایر کاربران نیز از مناطق مختلف دنیا وارد یوز و پارسی جو میشوند، ولی نکته آن که بازار این موتورها روی اینترنت نخواهد بود. بیشتر بازار آنها باید بر بازار بومی متمرکز باشد؛ یعنی جویشگرهای بومی دنبال خدمات مشابه گوگل نیستند و نباید هم سعی کنند با گوگل رقابت کنند. بلکه باید با ارائه خدمات بومی جذاب رفتهرفته کاربران را به سمت خود جذب کنند. در حال حاضر جویشگرهای بومی در حوزه فارسی تمرکز دارند ولی ممکن است که بسته به راهبردهای خود در حوزه زبانهای انگلیسی و عربی هم ورود کنند.
سوال: لطفاً در خصوص پارسی جو و یوز توضیحات تکمیلی ارائه دهید.
جواب: شما وقتی وارد جویشگرها میشوید شاید تصوری از ابعاد گسترده این خدمت به ذهن شما نرسد. این جویشگرها واقعاً دنیای عظیمی از منابع پردازشی در پشت سر خوددارند که قادر هستند میلیاردها صفحه را پردازش کرده و پرسشهای انجامشده را در دنیای وب جستجو و نمایش دهند.
اولین قدم در جویشگرها یافتن و جمعآوری صفحات وب است که اصطلاحاً خزش مینامیم. در هنگام خزش نکات زیادی است که باید رعایت شود که با محدودیت منابع و پهنای باند مواجه نشویم. همچنین سرورهای وب نباید از مراجعه زیاد و بیموقع ما دچار عصبانیت شده و دسترسی جویشگر را سد کنند. بنابراین سیاستها متفاوت است. یک موتور ممکن است با تعداد کمتری صفحه تمرکز بر کیفیت محتوا داشته باشد. پس خزش جویشگرها بسته به الگوریتمها و سیاستها از یک جویشگر به جویشگر دیگر متفاوت است؛ یعنی خزشی که پارسی جو دارد با یوز متفاوت است.
مرحله بعد بحث نمایهسازی است. اینکه چه کلمات و کلید واژههایی به عنوان نمایه در هر متنی انتخاب شود؟ باز این الگوریتمهای خاص خودش را دارد و مسائل خط و زبان فارسی نیز مطرح است. در واقع قابلیت جویشگرها با هم متفاوت است که کلید واژه ها را چگونه کنار هم قرار دهند و بتوانند نیاز کاربران را برآورده کنند. در مرحله آخر که اهمیت زیادی دارد، مرحله رتبه بندی است. ممکن است مستندات زیادی باشند که مرتبط با پرسش کاربر باشند. حالا هنر جویشگر این است که این صفحات را به چه ترتیبی نمایش دهد؛ مسلماً پارسی جو و یوز در نمایهسازی و رتبه بندی شان با هم متفاوت هستند. اینکه کدام بهتر است؟ طبیعتاً کاربران هستند که تعیین میکنند کدام مناسبتر هست.
در خدمات جانبی هم مثل تصویر، ویدئو، خبر و ترجمه ماشینی، اینها کاملاً با هم متفاوتاند. یعنی یوز روی جستجوی وب، وبلاگ، تصویر و خبر تاکید بیشتری دارد و پارسی جو روی جستجوی وب، تصویر، آوا، نقشه، ویدئو و نهایتاً خبر تاکید دارد. پارسی جو همزمان با نسخه پنجمش هم بحث بازار، کافه کجا و خدمات جدید دانلود را نیز راهاندازی کرد که شما میتوانید روی وبگاه آن ملاحظه کنید.
علیرغم همه این موارد، موتورهای یوز و پارسی جو خیلی نتوانستند بازار جویش را مقابل گوگل داشته باشند. علتش هم این است که هنوز خدمات بومی و داخلیشان به صورت قوی شکل نگرفته است. در نهایت ما به دنبال این هستیم تا با برقراری ارتباط با دارندگان محتوای داخلی و با کمک به ایدههایی که میتواند به خدمات داخلی منجر شود، جویشگرهای داخلی را در کنار شرکتهای دانش بنیان قرار دهیم، که حتماً در مراحل بعد اجرایی خواهیم کرد. در نهایت کاربران هستند که باید در استفاده و توسعه این جویشگرها یاری رسانند و تا وقتی که مورد اقبال کاربران قرار نگیرد رشد چندانی نخواهد داشت.
سوال: در رابطه با تولید محتوا توسط این جویشگرها و آغاز مراحل تجاریسازی توضیح بفرمایید.
جواب: یکی از موارد با اهمیت همین بحث محتوا و بروز آوری محتواست که از اولویتهای اصلی طرح است، ولی اینجا چالشی هم وجود دارد؛ چرا که برای بحث محتوا متولیان زیادی داریم. از طرفی به ما گفته میشود که در واقع خروجی اصلی طرح جویشگر، محتوا نیست و توسعه محتوا باید در پروژههای دیگری دنبال شود، ولی میگوییم که اگر محتوای بومی نداشته باشیم در واقع جویشگر بومی خیلی توجیه ندارد و خیلیها هم میگویند ما اصلاً گوگل داریم چرا باید جویشگر بومی داشته باشیم؟ آنجاست که آنها درست میگویند. پس ما برای اینکه بحث جویشگر بومی را هویت بدهیم باید در واقع محتوای بومی را تقویت کنیم. پس این موضوع بسیار اهمیت دارد و استقبال هم میشود اگر هر کسی در واقع پیشنهاد مناسبی در این حوزه داشته باشد مطرح کند. ما در حال حاضر بحث کنسرسیوم ملی محتوا را داریم که میتواند راهگشا باشد یا بحثهای مشابه ای که میتواند در سطح ملی یا سطح کوچک تری مطرح شود.
سوال: برای رفع معایب و نقایص جویشگرهای بومی، نحوه انتقال پیشنهادهای مردم به شما چگونه است؟
جواب: این موضوع را سایر مسئولین هم چندین بار تاکید کردند که مردم باید این جویشگرها را استفاده کنند. اگر مردم استفاده نکنند هیچ بهبودی در جویشگرها اتفاق نمیافتد. بهبود هم زمانی اتفاق میافتد که از سوی مردم پاسخ مناسب دریافت کند. در همین راستا جویشگرها برای جذب کاربران بیشتر، به دقت بازخوردهای کاربران را مطالعه میکنند و با توجه به پیشنهادهایی که از کاربران میگیرد برنامهریزی توسعه را انجام میدهند. در جویشگرها علاوه بر لاگ کاربران، امکان اخذ بازخورد مستقیم در بخش تماس با ما وجود دارد. به عنوان مثال سامانه ترجمه ماشینی ترگمان در پارسی جو قرار داده شده است که اندازهگیری ما نشان میدهد دقت این ترجمه ماشینی از ترجمه گوگل بهتر است. مسلماً اگر کاربران از این خدمت استفاده کرده و بازخورد خود را ارسال کنند دقت این ترجمه رفتهرفته بهتر خواهد شد. در کره جنوبی به دلیل استقبال مردمی از جویشگرهای داخلی سهم گوگل بسیار اندک شده و اولویت با جویشگرهای داخلی است که خود باعث بهبود کیفیت خدمات شده است. پس مردم ما هم باید استفاده از جویشگرهای داخلی را در اولویت قرار دهند وگرنه دولت هر چقدر هم سرمایهگذاری کند بیفایده است.
سوال: در پایان اگر نکته خاصی مطرح نشده است بفرمایید.
جواب: یکی از موارد بنده شفافسازی بودجه بود که شما سؤال کردید. یکی هم بحث افتتاح چند باره پارسی جو بود. ما تا کنون هیچ وقت پارسی جو را افتتاح نکرده بودیم. نسخههای قبلی این پروژه از سال 1391 بر روی وب رفته بود و تا کنون هم خدمت دهی در قالب جویشگر متنی را هم داشت، ولی به دلیل نداشتن زیرساختهای لازم در پژوهشگاه اقدامی به افتتاح رسمی آن نشده بود. در سال 93 بعد از تخصیص اعتبار به خرید سرورها و اجاره پهنای باند مناسب در مرکز داده پژوهشگاه امکان اعلان عمومی و افتتاح رسمی آن فراهم شد که همزمان با بهرهبرداری از نسخه 5 پارسی جو شد. این پروژه تا به حال تنها از طریق پژوهشگاه تأمین اعتبار شده است و تأمین اعتبار آن از محل طرح، منوط به تأیید شورای راهبری است که در دست بررسی این شورا قرار گرفته است. در خصوص بودجههای پژوهشی طرح جویشگر باید بگویم که ما هنوز بودجهای را هزینه نکردهایم. به زودی نتیجه فراخوان اولین دسته پروژهها هم اعلام میشود که پارسی جو و یوز و سایرین را شامل میشود و رسماً اعلام میشود. آن بخشی هم که تاکنون هزینه شده است همانطوریکه توضیح دادم برای خرید تجهیزات مرکز داده و نگهداری موقت خدمات بوده است.
انتهای پیام
افزودن دیدگاه جدید