متنياب - استخراج اطلاعات از بانك جزوات
شايد براي شما هم پيش آمده، دسترسي به يك بانك اطلاعات داريد، جستجو ميكنيد و متن را در صفحات وب در قالب HTML دريافت مينماييد. طبيعتاً ذخيره ميكنيد و بعد كه ميخواهيد استفاده كنيد، حجم زيادي مطالب بيربط و تبليغات دورتادور مطلب را گرفته است.
من از بانك اطلاعات فرهنگستان علوم اسلامي خيلي استفاده ميكردم، وقتي كه آنجا بودم، بعد از اينكه تمامي حدود هفت هزار جزوه مباحث استاد حسيني (ره) درون اين بانك قرار گرفت. صفحات HTML را كه ذخيره ميكردم، اين نرمافزار را كنار آنها كپي كرده و يكبار اجرا ميكردم. فوري تمام صفحات HTML را باز كرده، تگهاي ابتدا و انتهاي متن را پيدا نموده و متن جزوه را استخراج كرده و در فايلي با فرمت TXT ذخيره ميكرد. بعد هم فايلهاي HTML تبديل شده را به پوشهاي با همين نام منتقل ميساخت.
سورس اين برنامه به زبان VB۶ است. ميتوانيد تگ ابتدا و انتها را متناسب با منابع خود تغيير داده و متنهاي مورد نظر خود را استخراج نماييد.
بيشک دليلي بوده كه توجهات جلب شده؛
عنوان، تصوير يا توضيحي كه براي اين مطلب آمده،
دليل را بنويس و دگمه دانلود را كليك كن.
بررسي براي باراندازي...