|

سرویس ساناوب، ابزاری مناسب جهت جمع‌آوری مجموعه داده‌ای تمیز از سطح وب، برای آموزش مدل‌های زبانی بزرگ است.
این سرویس با دریافت دامنه‌های مختلف، تمامی صفحات آن‌ها را خزش و محتوای مفید هر صفحه را استخراج می‌کند.

استخراج محتوا