কীভাবে একটি বড় সাইট ক্রল করা যায় এবং স্ক্রিমিং ব্যাঙের এসইও স্পাইডার ব্যবহার করে ডেটা এক্সট্রাক্ট করা যায়

স্ক্রোগিং Frog এসইও স্পাইডার

আমরা এই মুহুর্তে বেশ কয়েকটি ক্লায়েন্টকে সহায়তা করছি মার্কেটো স্থানান্তর। বড় সংস্থাগুলি যেমন এন্টারপ্রাইজ সমাধানগুলি ব্যবহার করে, এটি একটি মাকড়সার জালের মতো যা বছরের পর বছর ধরে নিজেকে প্রক্রিয়া এবং প্ল্যাটফর্মের মধ্যে বিভক্ত করে তোলে ... যতক্ষণ না সংস্থাগুলি প্রতিটি টাচপয়েন্ট সম্পর্কে অবগত থাকেন না until

মার্কেটো এর মতো এন্টারপ্রাইজ বিপণন অটোমেশন প্ল্যাটফর্ম সহ ফর্মগুলি হ'ল সাইট এবং ল্যান্ডিং পৃষ্ঠাগুলিতে ডেটার প্রবেশের পয়েন্ট। সংস্থাগুলির প্রায়শই তাদের সাইটের জুড়ে হাজার হাজার পৃষ্ঠা এবং শত শত ফর্ম থাকে যা আপডেট করার জন্য চিহ্নিত করা দরকার।

এটির জন্য দুর্দান্ত সরঞ্জাম ব্যাঙের এসইও স্পাইডার চিৎকার করছে… ক্রলিং, অডিটিং এবং কোনও সাইট থেকে ডেটা আহরণের জন্য সম্ভবত বাজারের সবচেয়ে জনপ্রিয় প্ল্যাটফর্ম। প্ল্যাটফর্মটি বৈশিষ্ট্য সমৃদ্ধ এবং আপনার প্রয়োজনীয় প্রতিটি কার্যক্রমে শত শত বিকল্প সরবরাহ করে।

চিৎকার ব্যাঙ এসইও স্পাইডার: ক্রল এবং এক্সট্রাক্ট

স্ক্রিমিং ফ্রগ এসইও স্পাইডারের একটি মূল বৈশিষ্ট্য হ'ল আপনি কাস্টম এক্সট্রাকশন ভিত্তিক করতে পারেন perform রেজেক্স, এক্সপ্যাথ, বা সিএসপিথ সুনির্দিষ্ট এটি চূড়ান্তভাবে কার্যকর হয় কারণ আমরা ক্লায়েন্টের সাইটগুলি ক্রল করতে এবং পৃষ্ঠা থেকে MunchkinID এবং formId মানগুলি নিরীক্ষণ এবং ক্যাপচার করতে চাই।

সরঞ্জাম সহ, খুলুন কনফিগারেশন> কাস্টম> এক্সট্রাকশন আপনি নিষ্কাশন করতে চান উপাদান সনাক্ত করতে।

screamingfrog কাস্টম নিষ্কাশন

নিষ্কাশন পর্দা কার্যত সীমাহীন ডেটা সংগ্রহের অনুমতি দেয়:

চিৎকার ব্যাঙ এসইও স্পাইডার এক্সট্রাকশন বিধিগুলি

রেজেক্স, এক্সপ্যাথ এবং সিএসপ্যাথ এক্সট্রাকশন

মঞ্চকিনআইডি-র জন্য, সনাক্তকারীটি পৃষ্ঠার মধ্যে থাকা ফর্ম স্ক্রিপ্টের মধ্যে অবস্থিত:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

তারপরে আমরা একটি প্রয়োগ করি রেজেক্স বিধি পৃষ্ঠায় sertedোকানো স্ক্রিপ্ট ট্যাগের মধ্যে থেকে আইডি ক্যাপচার করতে:

Regex: ["']id["']: *["'](.*?)["']

ফর্ম আইডির জন্য, ডেটা মার্কেটো ফর্মের মধ্যে একটি ইনপুট ট্যাগে রয়েছে:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

আমরা একটি প্রয়োগ এক্সপথ নিয়ম পৃষ্ঠায় sertedোকানো ফর্মের মধ্যে থেকে আইডি ক্যাপচার করতে। এক্সপাথ ক্যোয়ারী একটি ইনপুট সহ একটি ফর্ম সন্ধান করে ফর্মিড, তারপর নিষ্কাশন সংরক্ষণ করে মূল্য:

XPath: //form/input[@name="formid"]/@value

চিৎকার ব্যাঙ এসইও স্পাইডার জাভাস্ক্রিপ্ট রেন্ডারিং

স্ক্রিমিং ফ্রোগের আর একটি দুর্দান্ত বিকল্পটি হ'ল আপনি পৃষ্ঠার HTML এ সীমাবদ্ধ নন, আপনি যে কোনও জাভাস্ক্রিপ্ট রেন্ডার করতে পারেন যা আপনার সাইটের মধ্যে ফর্মগুলি সন্নিবেশ করতে চলেছে। মধ্যে কনফিগারেশন> স্পাইডার, আপনি রেন্ডারিং ট্যাবে যেতে পারেন এবং এটি সক্ষম করতে পারেন।

চিৎকার ব্যাঙ এসইও স্পাইডার জাভাস্ক্রিপ্ট রেন্ডারিং

অবশ্যই সাইটটি ক্রল করতে কিছুটা বেশি সময় নেয় না, তবে আপনি জাভাস্ক্রিপ্ট দ্বারা ক্লায়েন্ট-পাশাপাশি রেন্ডার করা ফর্ম পাশাপাশি সার্ভার-সাইড inোকানো ফর্মগুলি পাবেন।

যদিও এটি একটি খুব নির্দিষ্ট অ্যাপ্লিকেশন, আপনি বড় সাইটের সাথে কাজ করছেন বলে এটি অবিশ্বাস্যরূপে কার্যকর। আপনার ফর্মগুলি পুরো সাইট জুড়ে কোথায় এম্বেড করা হয়েছে তা আপনি নিখুঁতভাবে নিরীক্ষণ করতে চাইবেন।

স্ক্রিমিং ফ্রগ এসইও স্পাইডারটি ডাউনলোড করুন

আপনি কি মনে করেন?

এই সাইট স্প্যাম কমাতে Akismet ব্যবহার করে। আপনার ডেটা প্রক্রিয়া করা হয় তা জানুন.