ਵੈੱਬ ਨੂੰ ਕੈਪਚਰ ਅਤੇ ਕਨਵਰਟ ਕਰਨ ਲਈ ਟੂਲ

ਵੈੱਬ ਸਕ੍ਰੈਪਰ ਦਸਤਾਵੇਜ਼

ਵੈਬ ਸਕ੍ਰੈਪ ਬਣਾਉਣ ਲਈ ਤੁਹਾਨੂੰ ਹੇਠ ਲਿਖੀਆਂ ਟੈਬਾਂ ਵਿੱਚ ਫੈਲੀਆਂ ਪੰਜ ਕਿਸਮਾਂ ਦੀ ਜਾਣਕਾਰੀ ਦੇਣੀ ਪਵੇਗੀ.

  1. ਸਕ੍ਰੈਪ ਵਿਕਲਪ
  2. ਟੀਚਾ ਵੈੱਬਸਾਈਟ
  3. ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼
  4. ਨਿਰਯਾਤ ਚੋਣਾਂ
  5. ਸਮਾਂ-ਤਹਿ ਸਕ੍ਰੈਪ

ਸਕ੍ਰੈਪ ਵਿਕਲਪ

ਹੇਠ ਲਿਖੀਆਂ ਸਾਰੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸਕ੍ਰੈਪ ਵਿਕਲਪਾਂ ਟੈਬ ਤੇ ਵੈੱਬ ਸਕ੍ਰੈਪ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰਨ ਲਈ ਉਪਲਬਧ ਹਨ.

ਸਕ੍ਰੈਪ ਨਾਮ ਖੁਰਚਣ ਦਾ ਨਾਮ.

ਲਿੰਕ ਦੀ ਪਾਲਣਾ ਕਰੋ ਹੇਠਾਂ ਦਿੱਤੇ ਵਿਕਲਪ ਮੁਹੱਈਆ ਕਰਦੇ ਹਨ ਕਿ ਖੁਰਚਣ ਲਿੰਕਾਂ ਦੀ ਪਾਲਣਾ ਕਿਵੇਂ ਕਰੇ:

ਫਾਈਲ ਡਾਉਨਲੋਡ ਨੂੰ ਅਣਡਿੱਠ ਕਰੋ ਇਕ ਵਾਰ ਕੋਈ ਲਿੰਕ ਸੈੱਟ ਕਰੋ, ਜਿਸ ਦਾ ਦੌਰਾ ਕਰਨ 'ਤੇ ਫਾਈਲ ਡਾਉਨਲੋਡ ਕਰਨ ਦਾ ਕਾਰਨ ਬਣਦਾ ਹੈ ਜਦੋਂ ਡਾ downloadਨਲੋਡ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ.

ਰੋਬੋਟ.ਟੈਕਸਟ ਫਾਈਲ ਨੂੰ ਅਣਡਿੱਠ ਕਰੋ ਜੇ ਸੈੱਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਵੈਬ ਪੇਜਾਂ ਤੇ ਜਾ ਸਕਦੇ ਹਨ ਆਮ ਤੌਰ ਤੇ ਵੈਬਸਾਈਟ ਦੇ ਮਾਲਕ ਦੁਆਰਾ ਘੁੰਮਣ ਤੋਂ ਬਾਹਰ ਕੱ .ੇ ਜਾਂਦੇ ਹਨ.

ਗਲਤੀ ਪੰਨਿਆਂ ਨੂੰ ਅਣਡਿੱਠ ਕਰੋ ਜੇਕਰ ਵੈੱਬ ਸਕ੍ਰੈਪਰ ਸੈੱਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਕਿਸੇ ਵੀ ਵੈੱਬ ਪੰਨਿਆਂ ਨੂੰ ਛੱਡ ਦਿੱਤਾ ਜਾਵੇਗਾ ਜੋ ਗਲਤੀ ਦੀ ਰਿਪੋਰਟ ਕਰਦੇ ਹਨ। ਇਸ ਲਈ ਕੋਈ ਵੀ HTTP ਸਥਿਤੀ ਕੋਡ 400 ਜਾਂ ਵੱਧ।

URL ਦੇ ਟੁਕੜਿਆਂ ਨੂੰ ਅਣਡਿੱਠ ਕਰੋ ਜੇਕਰ ਵੈੱਬ ਸਕ੍ਰੈਪਰ ਸੈੱਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ URL ਦੇ ਬਾਅਦ ਦੇ ਹਿੱਸੇ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰ ਦੇਵੇਗਾ # ਇਹ ਵਿਸ਼ੇਸ਼ਤਾ ਆਮ ਤੌਰ 'ਤੇ ਉਸੇ ਪੰਨੇ 'ਤੇ ਬੁੱਕਮਾਰਕ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਵਰਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ ਇਸ ਤਰ੍ਹਾਂ ਆਮ ਤੌਰ 'ਤੇ ਬੇਲੋੜੇ ਪੰਨਿਆਂ ਨੂੰ ਸਕ੍ਰੈਪ ਕੀਤਾ ਜਾਵੇਗਾ। ਹਾਲਾਂਕਿ, ਕੁਝ ਵੈੱਬਸਾਈਟਾਂ ਇਸ ਵਿਸ਼ੇਸ਼ਤਾ ਦੀ ਵਰਤੋਂ ਵੱਖਰੀ ਸਮੱਗਰੀ ਦਿਖਾਉਣ ਲਈ ਕਰਦੀਆਂ ਹਨ, ਇਸ ਸਥਿਤੀ ਵਿੱਚ ਇਸ ਸੈਟਿੰਗ ਨੂੰ ਅਯੋਗ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਵਿਕਲਪ ਸਿਰਫ਼ ਉਦੋਂ ਲਾਗੂ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਲਿੰਕਾਂ ਦਾ ਅਨੁਸਰਣ ਕਰਨਾ ਲੋੜ ਅਨੁਸਾਰ ਨਹੀਂ ਹੁੰਦਾ।

ਡੁਪਲਿਕੇਟ ਨੂੰ ਅਣਡਿੱਠ ਕਰੋ ਜੇ ਸੈਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਇਹ ਉਹਨਾਂ ਸਫ਼ਿਆਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰ ਦੇਵੇਗਾ ਜੋ ਤੁਹਾਡੇ ਦੁਆਰਾ ਨਿਰਧਾਰਤ ਕੀਤੀ ਗਈ ਸਮਾਨਤਾ ਦੇ ਬਰਾਬਰ ਜਾਂ ਵੱਧ ਹਨ, ਉਦਾਹਰਣ ਲਈ ਤੁਸੀਂ ਉਹਨਾਂ ਪੰਨਿਆਂ ਨੂੰ ਨਜ਼ਰ ਅੰਦਾਜ਼ ਕਰ ਸਕਦੇ ਹੋ ਜੋ 95% ਸਮਾਨ ਹਨ.

ਸੀਮਾ ਸਕ੍ਰੈਪ ਤੁਹਾਨੂੰ ਇਹ ਦਰਸਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਕਿ ਰੁਕਣ ਤੋਂ ਪਹਿਲਾਂ ਕਿੰਨੇ ਪੰਨੇ ਵੈਬ ਸਕ੍ਰੈਪਰ ਨੂੰ ਖੁਰਚਣੇ ਚਾਹੀਦੇ ਹਨ.

ਮੇਰਾ ਟਾਈਮਜ਼ੋਨ ਵਰਤੋਂ ਜੇ ਨਿਰਧਾਰਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਵੈਬ ਸਕ੍ਰੈਪਰ ਨੂੰ ਕਿਸੇ ਤਾਰੀਖ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰਨ ਲਈ ਬਦਲਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ into ਤੁਹਾਡਾ ਸਥਾਨਕ ਸਮਾਂ ਖੇਤਰ ਤੁਹਾਡਾ ਸਮਾਂ ਜ਼ੋਨ ਅਕਾਉਂਟ ਪੇਜ 'ਤੇ ਸੈੱਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ.

ਲੋਕੈਸ਼ਨ ਭੂਗੋਲਿਕ ਸਥਾਨ ਵੈਬ ਸਕ੍ਰੈਪਰ ਤੋਂ ਸਕ੍ਰੈਪ ਪ੍ਰਦਰਸ਼ਨ ਕਰੇਗੀ. ਇਹ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦਾ ਹੈ ਜੇ ਟਾਰਗੇਟ ਵੈਬਸਾਈਟ 'ਤੇ ਸਥਿਤੀ ਦੇ ਅਧਾਰ ਤੇ ਪਾਬੰਦੀਆਂ ਹਨ.

ਡਿਫਾਲਟ ਮਿਤੀ ਫਾਰਮੈਟ ਤਾਰੀਖਾਂ ਨੂੰ ਬਦਲਣ ਵੇਲੇ ਜਿੱਥੇ ਤਾਰੀਖ ਦਾ ਫਾਰਮੈਟ ਨਿਰਧਾਰਤ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਵੈਬ ਸਕ੍ਰੈਪਰ ਇਸ ਦੀ ਬਜਾਏ ਇਸ ਚੁਣੇ ਗਏ ਫਾਰਮੈਟ ਵਿੱਚ ਡਿਫੌਲਟ ਹੋ ਜਾਵੇਗਾ.

ਪੇਜ ਲੋਡ ਦੇਰੀ ਇਹ ਸਮਾਂ ਮਿਲੀਸਕਿੰਟ ਵਿੱਚ ਹੈ ਵੈਬ ਸਕ੍ਰੈਪਰ ਨੂੰ ਕਿਸੇ ਪੰਨੇ ਨੂੰ ਪਾਰਸ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਇੰਤਜ਼ਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ. ਇਹ ਬਹੁਤ ਫਾਇਦੇਮੰਦ ਹੈ ਜੇ ਕਿਸੇ ਪੰਨੇ ਵਿੱਚ ਬਹੁਤ ਸਾਰੀਆਂ ਏਜੇੈਕਸ ਹਨ ਜਾਂ ਲੋਡ ਕਰਨ ਵਿੱਚ ਹੌਲੀ ਹੈ.

ਟੀਚਾ ਵੈੱਬਸਾਈਟ

ਟੀਚਾ ਵੈੱਬਸਾਈਟ

ਟਾਰਗੇਟ ਵੈਬਸਾਈਟ ਟੈਬ ਵਿੱਚ ਤੁਸੀਂ ਉਹਨਾਂ ਵੈਬਸਾਈਟਾਂ ਨੂੰ ਨਿਸ਼ਚਿਤ ਕਰਦੇ ਹੋ ਜਿਨ੍ਹਾਂ ਤੋਂ ਤੁਸੀਂ ਡੇਟਾ ਐਕਸਟਰੈਕਟ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ। ਕਿਸੇ ਵੈਬਸਾਈਟ ਤੋਂ ਡੇਟਾ ਐਕਸਟਰੈਕਟ ਕਰਨ ਲਈ ਸਕ੍ਰੈਪ ਟੂਲ ਨੂੰ ਦੱਸਣ ਲਈ ਤੁਹਾਨੂੰ ਪਹਿਲਾਂ ਮੁੱਖ URL ਨਿਰਧਾਰਤ ਕਰਨਾ ਪਏਗਾ ਜੋ ਤੁਸੀਂ ਹੋ intਉਦਾਹਰਣ ਵਿੱਚ e उत्सुक http://www.example.com/shop/ ਇਹ ਉਹ ਸਨ ਜੋ ਸਕ੍ਰੈਪਰ ਇਸ ਦੇ ਖੁਰਡੇ ਨੂੰ ਸ਼ੁਰੂ ਕਰ ਦੇਵੇਗਾ, ਇਹ ਸਧਾਰਣ ਵੈੱਬਪੇਜ, ਪੀਡੀਐਫ ਦਸਤਾਵੇਜ਼, ਐਕਸਐਮਐਲ ਦਸਤਾਵੇਜ਼, ਜੇਐਸਓਐਨ ਦਸਤਾਵੇਜ਼, ਆਰਐਸਐਸ ਫੀਡ ਜਾਂ ਸਾਈਟਮੈਪ ਹੋ ਸਕਦਾ ਹੈ. ਜੇ ਇਹ ਵੈਬ ਪੇਜ ਜਾਂ ਪੀ ਡੀ ਐਫ ਦਸਤਾਵੇਜ਼ ਨਹੀਂ ਹੈ ਤਾਂ ਸਕ੍ਰੈਪਰ ਫਾਈਲ ਵਿਚਲੇ ਸਾਰੇ ਲਿੰਕਾਂ ਨੂੰ ਲੱਭੇਗਾ ਅਤੇ ਹਰ ਇਕ ਦਾ ਦੌਰਾ ਕਰੇਗਾ.

ਸਿਰਫ ਟੀਚੇ ਵਾਲੇ ਯੂਆਰਐਲ ਵਿੱਚ ਲੱਭੇ ਲਿੰਕਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਲਈ ਅਤੇ ਨਾ ਹੀ ਅਗਲੇ ਪੰਨੇ ਜੋ ਤੁਸੀਂ ਸੈੱਟ ਕਰ ਸਕਦੇ ਹੋ ਲਿੰਕ ਦੀ ਪਾਲਣਾ ਕਰੋ ਸਕ੍ਰੈਪ ਵਿਕਲਪ ਨੂੰ ਪਹਿਲੇ ਪੇਜ ਤੇ. ਇਹ ਟੀਚੇ ਦਾ ਯੂਆਰਐਲ ਸਿਰਫ ਬਾਕੀ ਬਚੇ ਸਕ੍ਰੈਪ ਨੂੰ ਸੀਡ ਕਰਨ ਲਈ ਵਰਤੇਗਾ.

URL ਪੈਟਰਨ

ਡਿਫੌਲਟ ਰੂਪ ਵਿੱਚ, ਵੈਬ ਸਕ੍ਰੈਪਰ ਹਰੇਕ ਲਿੰਕ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ ਜਿਸਦਾ ਉਹ ਖੋਜ ਕਰਦਾ ਹੈ ਹਰੇਕ ਵੈਬ ਪੇਜ ਤੇ ਖੋਜਿਆ ਜਾਂਦਾ ਹੈ. ਜੇ ਤੁਸੀਂ ਇਸ ਨੂੰ ਸੀਮਤ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਜੋ ਲਿੰਕ ਨੂੰ ਜੋੜਦਾ ਹੈ ਵੈਬ ਸਕ੍ਰੈਪਰ ਇਸ ਤਰ੍ਹਾਂ ਕਰਨ ਦਾ ਇੱਕ ਸਧਾਰਨ ਤਰੀਕਾ ਹੈ ਇੱਕ URL ਪੈਟਰਨ ਨਿਰਧਾਰਤ ਕਰਨਾ। ਇਹ ਸ਼ਕਤੀਸ਼ਾਲੀ ਤਕਨੀਕ ਮੁੱਖ ਤੌਰ 'ਤੇ ਤਾਰੇ ਦੇ ਨਾਲ ਇੱਕ URL ਨੂੰ ਵਾਈਲਡ ਕਾਰਡ ਵਜੋਂ ਦਰਸਾਉਣ ਲਈ ਕੰਮ ਕਰਦੀ ਹੈ ਕਿ ਕੋਈ ਵੀ ਅੱਖਰ ਪੈਟਰਨ ਦੇ ਇਸ ਹਿੱਸੇ ਵਿੱਚ ਮੌਜੂਦ ਹੋ ਸਕਦੇ ਹਨ। ਉਦਾਹਰਣ ਦੇ ਲਈ http://www.example.com/*/articles/* ਵੈਬਸਾਈਟ ਦੇ ਰੂਟ ਤੋਂ ਦੂਜੀ ਡਾਇਰੈਕਟਰੀ ਦੇ ਤੌਰ ਤੇ ਲੇਖਾਂ ਵਾਲੇ ਕਿਸੇ ਵੀ URL ਨੂੰ ਖਤਮ ਕਰ ਦੇਵੇਗਾ.

ਯੂਆਰਐਲ ਪੈਟਰਨ ਨੂੰ ਪ੍ਰਭਾਸ਼ਿਤ ਕਰਨ ਦਾ ਇਕ ਵਧੇਰੇ ਪਾਬੰਦ wayੰਗ ਹੈ ਵਿਕਲਪਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਤ ਕਰਨਾ. ਉਦਾਹਰਣ ਵਜੋਂ ਇਹ ਉਦਾਹਰਣ ਸਿਰਫ ਸਟੋਰ ਜਾਂ ਖ਼ਬਰਾਂ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ: http://www.example.com/ /*

ਇਸ ਲਈ ਇਹ ਇਸ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੋਵੇਗਾ http://www.example.com/store/products/1 ਪਰ ਨਾ http://www.example.com/about/.

ਜਾਂ ਵਿਕਲਪਕ ਤੌਰ 'ਤੇ ਇਹ ਸੰਭਵ ਹੈ ਕਿ ਕਿਸੇ ਚੀਜ਼ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੋਵੇ. ਉਦਾਹਰਨ ਲਈ ਇਹ ਉਦਾਹਰਨ ਸਟੋਰ ਜਾਂ ਖਬਰਾਂ ਨਾਲ ਮੇਲ ਨਹੀਂ ਖਾਂਦੀ: http://www.example.com/ /*

ਇਸ ਲਈ ਇਹ ਇਸ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੋਵੇਗਾ http://www.example.com/about/ ਪਰ ਨਾ http://www.example.com/store/products/1!

ਇੱਕ URL ਪੈਟਰਨ ਵਿੱਚ ਕੀਵਰਡ ਵੀ ਹੋ ਸਕਦੇ ਹਨ। ਇੱਕ ਕੀਵਰਡ ਇੱਕ ਡਬਲ ਵਰਗ ਬਰੈਕਟਾਂ ਵਿੱਚ ਮੌਜੂਦ ਕੋਈ ਵੀ ਚੀਜ਼ ਹੈ। ਇਸ ਲਈ [[URL_START]]www.example.com* ਇੱਕ URL ਦੀ ਕਿਸੇ ਵੀ ਵੈਧ ਸ਼ੁਰੂਆਤ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਇਸ ਲਈ http://www.example.com/, https://www.example.com/ ਜ ਵੀ ftp://www.example.com/ ਉਦਾਹਰਣ ਦੇ ਲਈ.

ਬੀਜ URL ਦਾ

ਬੀਜ ਯੂਆਰਐਲ ਉਪਭੋਗਤਾ ਨੂੰ ਯੂਆਰਐਲ ਦੀ ਸੂਚੀ ਨਿਰਧਾਰਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਵੈਬ ਸਕ੍ਰੈਪਰ ਦੁਆਰਾ ਕ੍ਰੌਲ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ. ਜੇ ਤੁਸੀਂ ਸਿਰਫ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਬੀਜ URL ਨੂੰ ਖਤਮ ਕਰ ਦਿਓ ਲਿੰਕ ਦੀ ਪਾਲਣਾ ਕਰੋ ਸਕ੍ਰੈਪ ਵਿਕਲਪ ਨੂੰ ਕੋਈ ਪੰਨੇ ਨਹੀਂ ਸਕ੍ਰੈਪ ਵਿਕਲਪ ਟੈਬ ਵਿੱਚ.

ਟਾਰਗੇਟ ਵੈੱਬਸਾਈਟ ਟੈਬ 'ਤੇ ਸੀਡ ਯੂਆਰਐਲ ਸੈੱਟ ਕਰਨ ਲਈ, ਟਾਰਗੇਟ ਸ਼ਾਮਲ ਕਰੋ ਬਟਨ 'ਤੇ ਕਲਿੱਕ ਕਰੋ ਫਿਰ ਸੈੱਟ ਸੀਡ ਯੂਆਰਐਲ ਚੈੱਕਬਾਕਸ ਦੀ ਜਾਂਚ ਕਰੋ ਅਤੇ ਹਰੇਕ URL ਨੂੰ ਇੱਕ ਵੱਖਰੀ ਲਾਈਨ 'ਤੇ ਸਕ੍ਰੈਪ ਕਰਨ ਲਈ ਨਿਰਧਾਰਤ ਕਰੋ।

ਇੱਕ ਟੈਂਪਲੇਟ URL ਤੋਂ ਬੀਜ URL ਬਣਾਓ

ਵਿਕਲਪਿਕ ਤੌਰ ਤੇ ਤੁਸੀਂ ਇੱਕ ਟੈਂਪਲੇਟ URL ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ ਆਪ ਬੀਜ URL ਤਿਆਰ ਕਰ ਸਕਦੇ ਹੋ, ਇਹ ਇੱਕ ਸਿੰਗਲ URL ਹੈ ਜਿਸ ਵਿੱਚ ਇੱਕ URL ਵੇਰੀਏਬਲ ਸ਼ਾਮਲ ਹੈ. ਇੱਕ URL ਵੇਰੀਏਬਲ ਦੁਹਰਾਇਆ ਜਾਣ ਵਾਲੀਆਂ ਸੰਖਿਆਵਾਂ ਦੀ ਇੱਕ ਸੀਮਾ ਨਿਸ਼ਚਤ ਕਰਦਾ ਹੈ.

ਅਰੰਭ ਨੰਬਰ ਉਹ ਨੰਬਰ ਹੁੰਦਾ ਹੈ ਜਿਸ ਤੇ URL ਵੇਰੀਏਬਲ ਦੀ ਗਿਣਤੀ ਕਰਨੀ ਸ਼ੁਰੂ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ, ਸੰਪੂਰਨ ਨੰਬਰ ਉਹ ਨੰਬਰ ਹੁੰਦਾ ਹੈ ਜਿਸ ਤੇ URL ਵੇਰੀਏਬਲ ਗਿਣਨਾ ਬੰਦ ਕਰ ਦੇਵੇਗਾ, ਦੁਹਰਾਓ ਸੰਖਿਆ ਉਹ ਨੰਬਰ ਹੁੰਦੀ ਹੈ ਜੋ URL ਦੇ ਵੇਰੀਏਬਲ ਦੇ ਹਰੇਕ ਦੁਹਰਾਓ ਲਈ ਵਾਧਾ ਕਰੇਗੀ.

ਉਦਾਹਰਣ ਲਈ ਹੇਠ ਦਿੱਤੇ ਟੈਂਪਲੇਟ URL ਲਈ http://www.example.com/search?pageNo=

ਇਹ ਫਿਰ ਹੇਠਾਂ ਦਿੱਤੇ ਬੀਜ URL ਬਣਾਏਗਾ:

ਪੋਸਟ ਕਰੋ

URL ਪੈਰਾਮੀਟਰਾਂ ਵਾਲਾ URL ਵੀ ਦਰਸਾ ਸਕਦਾ ਹੈ ਉਦਾਹਰਣ ਲਈ ਇੱਕ ਲੌਗਇਨ ਫਾਰਮ ਲਈ. ਅਜਿਹਾ ਕਰਨ ਲਈ ਟਾਰਗੇਟ URL ਦੇ ਪਾਠ ਬਕਸੇ ਵਿੱਚ ਫਾਰਮ ਨੂੰ URL ਨਿਰਧਾਰਤ ਕਰੋ ਅਤੇ ਵਰਤਣ ਲਈ ਲੋੜੀਂਦੇ ਪੋਸਟ ਪੈਰਾਮੀਟਰ ਸ਼ਾਮਲ ਕਰੋ. ਪੋਸਟ ਵੇਰੀਏਬਲ ਵੈਲਿਜ ਵਿੱਚ ਵਿਸ਼ੇਸ਼ ਗਰੈਬਜ਼ਆਈਟੀ ਵੇਰੀਏਬਲ ਵੀ ਸ਼ਾਮਲ ਹੋ ਸਕਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ:

ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼

ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਨਿਰਦੇਸ਼ ਵੈਬ ਸਕੈੈਪਰ ਨੂੰ ਦੱਸਦੇ ਹਨ ਕਿ ਟੀਚੇ ਦੀ ਵੈੱਬਸਾਈਟ ਨੂੰ ਖੁਰਚਣ ਵੇਲੇ ਕਿਹੜੀਆਂ ਕਾਰਵਾਈਆਂ ਕਰਨੀਆਂ ਹਨ. ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਨਿਰਦੇਸ਼ ਟੈਬ ਮੂਲ ਰੂਪ ਵਿੱਚ ਸਕ੍ਰੈਪ ਵਿਜ਼ਾਰਡ ਨੂੰ ਦਿਖਾਉਂਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਤੁਹਾਨੂੰ ਲੋੜੀਂਦੀਆਂ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਜੋੜਨਾ ਸੌਖਾ ਹੋ ਜਾਂਦਾ ਹੈ. ਇਸ ਵਿਜ਼ਰਡ ਨੂੰ ਵਰਤਣ ਦੀ ਇੱਕ ਚੰਗੀ ਉਦਾਹਰਣ ਨੂੰ. ਵਿੱਚ ਵੇਖਾਇਆ ਗਿਆ ਹੈ ਉਤਪਾਦ ਸੂਚੀ ਅਤੇ ਵੇਰਵੇ ਸਕ੍ਰੈਪਿੰਗ ਟਿutorialਟੋਰਿਅਲ.

ਇੱਕ ਵਾਰ ਜਦੋਂ ਤੁਸੀਂ ਸਕ੍ਰੈਪਿੰਗ ਸ਼ੁਰੂ ਕਰਨ ਲਈ ਤਿਆਰ ਹੋ ਜਾਂਦੇ ਹੋ ਤਾਂ ਦਬਾਓ ਨਵੀਂ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਸ਼ਾਮਲ ਕਰੋ ਲਿੰਕ ਨੂੰ.

ਇਹ ਵਿਜ਼ਾਰਡ ਨੂੰ ਖੋਲ੍ਹ ਦੇਵੇਗਾ ਅਤੇ ਆਪਣੇ ਆਪ ਹੀ ਟਾਰਗਿਟ URL ਨੂੰ ਲੋਡ ਕਰ ਦੇਵੇਗਾ, ਜਿਸ ਨਾਲ ਤੁਸੀਂ ਤੁਰੰਤ ਉਹ ਚੁਣ ਸਕਦੇ ਹੋ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਸਕ੍ਰੈਪ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ. ਜੇ ਇੱਕ ਵੈੱਬਪੇਜ ਜਾਂ ਪੀਡੀਐਫ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਲੋਡ ਕੀਤਾ ਗਿਆ ਹੈ ਤਾਂ ਤੁਸੀਂ ਕਿਸੇ ਵੀ ਲਿੰਕ ਤੇ ਕਲਿਕ ਕਰ ਸਕਦੇ ਹੋ ਅਤੇ ਇਹ ਆਮ ਵਾਂਗ ਕੰਮ ਕਰੇਗਾ, ਉਦਾਹਰਣ ਲਈ ਕਿਸੇ ਹੋਰ ਵੈੱਬਪੰਨੇ ਤੇ ਨੈਵੀਗੇਸ਼ਨ ਕਰਨ ਲਈ. ਜਦੋਂ ਤੱਕ ਤੁਸੀਂ ਕੋਈ ਵੀ ਕਿਰਿਆ ਨਹੀਂ ਚੁਣਦੇ, ਸਕ੍ਰੀਨ ਦੇ ਤਲ 'ਤੇ, ਇਸ ਪੋint ਸਮਗਰੀ 'ਤੇ ਕੋਈ ਵੀ ਕਲਿਕਸ ਐਚਟੀਐਮਐਲ ਐਲੀਮੈਂਟ ਦੀ ਚੋਣ ਕਰੇਗੀ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਕੱractਣਾ ਜਾਂ ਹੇਰਾਫੇਰੀ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ.

ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਬਾਰੇ ਸਮਝਣ ਦੀ ਪਹਿਲੀ ਗੱਲ ਇਹ ਹੈ ਕਿ ਉਹ ਹਰੇਕ ਵੈਬ ਪੇਜ ਤੇ ਡਿਫਾਲਟ ਤੌਰ ਤੇ ਚਲਾਏ ਜਾਂਦੇ ਹਨ. ਇਸ ਨੂੰ ਰੋਕਣ ਦਾ tempੰਗ ਟੈਂਪਲੇਟਸ ਦੀ ਵਰਤੋਂ ਦੁਆਰਾ ਹੈ. ਇੱਕ ਟੈਂਪਲੇਟ ਨੂੰ ਨਿਰਧਾਰਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜਦੋਂ ਕਿਸੇ ਕਿਰਿਆ ਨੂੰ ਕਰਦੇ ਹੋਏ ਜਿਵੇਂ ਕਿ ਕਿਸੇ ਲਿੰਕ ਤੇ ਕਲਿਕ ਕਰਨਾ, ਅਤੇ ਇਸਲਈ ਜਦੋਂ ਕੋਈ ਖਰਾਬੀ ਉਸ ਲਿੰਕ ਤੇ ਜਾਂਦੀ ਹੈ ਜਾਂ ਉਸ ਬਟਨ ਨੂੰ ਕਲਿਕ ਕਰਦੀ ਹੈ ਤਾਂ ਇਹ ਪਛਾਣ ਲਵੇਗੀ ਕਿ ਇਹ ਨਿਰਧਾਰਤ ਨਮੂਨੇ ਨਾਲ ਸੰਬੰਧਿਤ ਹੈ. ਇਹ ਵੱਖੋ ਵੱਖਰੀਆਂ ਪੇਜ ਕਿਸਮਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ. ਉਦਾਹਰਣ ਦੇ ਲਈ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਉਤਪਾਦ ਸ਼੍ਰੇਣੀ ਪੰਨਾ ਹੋ ਸਕਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਕੁਝ ਸੰਖੇਪ ਜਾਣਕਾਰੀ ਅਤੇ ਫਿਰ ਵੇਰਵੇ ਵਾਲਾ ਪੰਨਾ ਹੁੰਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਉਤਪਾਦ ਦੀ ਜਾਣਕਾਰੀ ਹੁੰਦੀ ਹੈ. ਦੋਵੇਂ ਪੰਨਿਆਂ ਨੂੰ ਸਕੈਰੇਪ ਨਿਰਦੇਸ਼ਾਂ ਦੇ ਵੱਖਰੇ ਸਮੂਹ ਦੀ ਜ਼ਰੂਰਤ ਹੋਏਗੀ.

ਸਕ੍ਰੈਪਰ ਟੈਂਪਲੇਟ

ਸ਼ੁਰੂ ਕਰਨ ਲਈ. ਦੀ ਚੋਣ ਕਰੋ ਕਲਿਕ ਕਰੋ ਐਕਸ਼ਨ, ਫਿਰ ਇਕ ਵਾਰ ਜਦੋਂ ਤੁਸੀਂ ਇਕਾਈਆਂ ਦੀ ਚੋਣ ਕਰ ਲੈਂਦੇ ਹੋ ਤਾਂ ਤੁਸੀਂ ਕਿਰਿਆ ਨੂੰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਅਤੇ ਕਲਿੱਕ ਕਰੋ ਅਗਲਾ ਵਿੱਚ ਟੈਪਲੇਟ ਦਾ ਨਾਮ ਦਰਜ ਕਰੋ ਬਟਨ ਇੱਕ ਟੈਂਪਲੇਟ ਬਣਾਓ ਟੈਕਸਟ ਬਾਕਸ ਹੁਣ ਜਦੋਂ ਵੀ ਸਕ੍ਰੈਪਰ ਇਹਨਾਂ ਕਿਰਿਆਵਾਂ ਨੂੰ ਲਾਗੂ ਕਰਦਾ ਹੈ, ਵਾਪਸ ਕੀਤਾ ਟੈਪਲੇਟ ਉਹ ਨਾਮ ਹੋਵੇਗਾ ਜੋ ਤੁਸੀਂ ਸਪਲਾਈ ਕੀਤਾ ਹੈ.

ਤਦ ਇੱਕ ਖਾਸ ਟੈਂਪਲੇਟ ਨੂੰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਲਈ, ਤੁਹਾਨੂੰ ਲੋੜੀਂਦੇ ਨਮੂਨੇ ਤੋਂ ਚੁਣਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ ਚਲਾਓ ਡਰਾਪ ਡਾਉਨ ਲਿਸਟ, ਜੋ ਕਿ ਵਿੰਡੋਜ਼ ਵਿੱਚ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ ਜੋ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਜੋੜਨ ਤੋਂ ਪਹਿਲਾਂ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ. ਟੈਪਲੇਟ ਦੀ ਚੋਣ ਕਰਨ ਵੇਲੇ ਤਿੰਨ ਮੁੱਖ ਵਿਕਲਪ ਹੇਠ ਲਿਖੇ ਅਨੁਸਾਰ ਹਨ:

ਇੱਕ ਵਾਰ ਜਦੋਂ ਤੁਸੀਂ ਇਹਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਵਿਕਲਪ ਚੁਣ ਲੈਂਦੇ ਹੋ, ਤਾਂ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਸਿਰਫ ਨਿਰਧਾਰਤ ਟੈਪਲੇਟ ਤੇ ਹੀ ਲਾਗੂ ਕੀਤੇ ਜਾਣਗੇ.

ਡਾਟਾ ਕੱ Data ਰਿਹਾ ਹੈ

ਤੁਸੀਂ ਵੇਖੋਗੇ ਕਿ ਜਦੋਂ ਤੁਸੀਂ ਚੁਣਦੇ ਹੋ ਐਕਸਟਰੈਕਟ ਡੇਟਾ ਕਾਰਵਾਈ. ਸਕਰੀਨ ਦਾ ਹੇਠਲਾ ਖੱਬਾ ਕੋਨਾ ਤੁਹਾਨੂੰ ਉਪਰੋਕਤ ਵਿੰਡੋ ਵਿੱਚ ਇੱਕ HTML ਤੱਤ ਦੀ ਚੋਣ ਕਰਨ ਜਾਂ ਇੱਕ ਗਲੋਬਲ ਪੇਜ ਵਿਸ਼ੇਸ਼ਤਾ ਚੁਣਨ ਲਈ ਸੱਦਾ ਦਿੰਦਾ ਹੈ.

ਗਲੋਬਲ ਪੇਜ ਦੀ ਜਾਇਦਾਦ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ, ਕਲਿੱਕ ਕਰੋ ਗਲੋਬਲ ਪੇਜ ਜਾਇਦਾਦ ਲਿੰਕ. ਫਿਰ ਪੁਸ਼ਟੀ ਕਰੋ ਕਿ ਤੁਸੀਂ ਜਾਰੀ ਰੱਖਣਾ ਚਾਹੁੰਦੇ ਹੋ. ਤੁਹਾਡੇ ਕੋਲ ਹੁਣ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਸੂਚੀ ਹੋਵੇਗੀ ਜੋ ਸਫ਼ੇ ਤੋਂ ਸਿੱਧਾ ਕੱ .ੇ ਜਾ ਸਕਦੇ ਹਨ. ਉਦਾਹਰਣ ਲਈ: ਪੰਨਾ ਸਿਰਲੇਖ.

ਇੱਕ ਦੀ ਚੋਣ ਕਰਨ ਲਈ, ਇਸ ਨੂੰ ਚੋਣਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚੋਂ ਚੁਣੋ ਅਤੇ ਕਲਿੱਕ ਕਰੋ ਅਗਲਾ ਨੂੰ ਡਾਟਾ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਡੇਟਾਸੇਟ.

ਜੇ ਤੁਸੀਂ ਪੂਰੇ ਐਚਟੀਐਮਐਲ ਐਲੀਮੈਂਟਸ ਵਿਚਲੇ ਡੇਟਾ ਨੂੰ ਐਕਸਟਰੈਕਟ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਨਾ ਕਿ ਪੂਰੇ ਪੇਜ ਨਾਲ ਸਬੰਧਤ, ਤੁਹਾਨੂੰ ਸਬੰਧਤ ਐਚਟੀਐਮਐਲ ਐਲੀਮੈਂਟਸ ਤੇ ਕਲਿਕ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਸਿੰਗਲ ਜਾਂ ਮਲਟੀਪਲ ਇਕਾਈਆਂ ਚੁਣ ਸਕਦੇ ਹੋ. ਹਾਲਾਂਕਿ ਜੇ ਤੁਸੀਂ ਮਲਟੀਪਲ ਆਈਟਮਾਂ ਦੀ ਚੋਣ ਕਰ ਰਹੇ ਹੋ ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਕੋਸ਼ਿਸ਼ ਕਰੋ ਅਤੇ ਮਲਟੀਪਲ ਆਈਟਮਾਂ ਦੀ ਚੋਣ ਕਰੋ ਜੋ ਉਸ ਤੋਂ ਬਾਅਦ ਇਕੋ ਜਿਹੇ ਕਾਲਮ ਵਿਚ ਕਈ ਕਤਾਰਾਂ ਹਨ, ਕਿਉਂਕਿ ਜੇ ਸਕ੍ਰੈਪਰ ਇਕ ਨਿਯਮ ਨਹੀਂ ਬਣਾ ਸਕਦਾ ਜੋ ਡੈਟਾ ਦੇ ਚੁਣੇ ਹੋਏ ਸੰਗ੍ਰਹਿ ਦੀ ਵਿਲੱਖਣ identifyੰਗ ਨਾਲ ਪਛਾਣ ਕਰ ਸਕੇ ਤਾਂ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਨਹੀਂ ਹੋਵੇਗਾ. ਬਣਾਉਣ ਦੇ ਯੋਗ ਹੋ. ਇਸ ਤੋਂ ਇਲਾਵਾ ਜੇ ਤੁਸੀਂ ਕਈਂ ਆਈਟਮਾਂ ਨੂੰ ਕਲਿਕ ਕਰ ਰਹੇ ਹੋ ਉਨ੍ਹਾਂ ਦੀ ਪਛਾਣ ਸਾਡੀ ਵੈਬ ਸਕ੍ਰੈਪਰ ਵਿਜ਼ਾਰਡ ਦੁਆਰਾ ਦੁਹਰਾਉਣ ਵਾਲੇ ਡੇਟਾ ਵਜੋਂ ਕੀਤੀ ਗਈ ਹੈ, ਤਾਂ ਉਸੇ ਸਮੂਹ ਵਿਚਲੇ ਸਾਰੇ ਦੁਹਰਾ ਰਹੇ ਡੇਟਾ ਆਪਣੇ ਆਪ ਚੁਣੇ ਜਾਣਗੇ. ਇੱਕ ਵਾਰ ਜਦੋਂ ਤੁਸੀਂ ਆਪਣੀਆਂ ਸਾਰੀਆਂ ਸਿੰਗਲ ਜਾਂ ਮਲਟੀਪਲ ਆਈਟਮਾਂ ਦੀ ਚੋਣ ਕਰ ਲੈਂਦੇ ਹੋ ਤਾਂ ਸਕ੍ਰੀਨ ਦੇ ਹੇਠਾਂ ਖੱਬੇ ਪਾਸੇ ਤੋਂ ਐਕਸਟਰੈਕਟ ਕਰਨ ਲਈ ਇੱਕ ਗੁਣ ਚੁਣੋ ਅਤੇ ਫਿਰ ਕਲਿੱਕ ਕਰੋ ਅਗਲਾ.

ਇੱਕ ਡਾਟਾਸੇਟ ਬਣਾਉਣਾ

ਡੈਟਾਸੇਟ ਸਕ੍ਰੀਨ ਤੁਹਾਨੂੰ ਇਸ ਨੂੰ ਬਦਲਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ ਕਿ ਕਿਵੇਂ ਡੇਟਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਉਦਾਹਰਣ ਲਈ ਤੁਸੀਂ ਇਸ ਦੇ ਅੰਦਰ ਡੇਟਾਸੇਟ ਅਤੇ ਕਾਲਮਾਂ ਦਾ ਨਾਮ ਬਦਲ ਸਕਦੇ ਹੋ, ਇਸਦਾ ਨਾਮ ਬਦਲਣ ਲਈ ਸਿਰਫ ਨਾਮ ਤੇ ਕਲਿਕ ਕਰੋ. ਜਦੋਂ ਤੁਸੀਂ ਇੱਕ ਡੈਟਾਸੇਟ ਵਿੱਚ ਇੱਕ ਕਾਲਮ ਜੋੜਦੇ ਹੋ ਤਾਂ ਤੁਹਾਨੂੰ ਨਮੂਨਾ ਵੀ ਚੁਣਨਾ ਪੈਂਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਇਸਨੂੰ ਚਲਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ. ਤੁਸੀਂ ਇਸਨੂੰ ਕਾਲਮ ਨਾਮ ਦੇ ਹੇਠਾਂ ਲਟਕਦੀ ਸੂਚੀ ਤੇ ਕਲਿਕ ਕਰਕੇ ਬਦਲ ਸਕਦੇ ਹੋ.

ਅਕਸਰ ਡਾਟਾ ਕੱractਣ ਵੇਲੇ, ਕੁਝ ਦੁਹਰਾਉਣ ਵਾਲੀਆਂ ਵਸਤੂਆਂ ਲਈ ਇਕਸਾਰ ਹੋ ਕੇ ਦੁਹਰਾਉਣਾ ਆਮ ਹੁੰਦਾ ਹੈ, ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰਨ ਲਈ ਕਿ ਸਹੀ ਕਤਾਰਾਂ ਅਜੇ ਵੀ ਇਕ ਦੂਜੇ ਨਾਲ ਜੁੜੀਆਂ ਹੋਈਆਂ ਹਨ ਲਿੰਕ ਕਾਲਮ ਮਾਪਦੰਡ, ਡੈਟਾਸੇਟ ਦੇ ਸਭ ਤੋਂ ਇਕਸਾਰ ਕਾਲਮ ਦੇ ਨਾਲ ਅਸੰਗਤ ਕਾਲਮਾਂ ਨੂੰ ਜੋੜਨ ਲਈ.

ਡੇਟਾਸੇਟ ਵਿੱਚ ਹੋਰ ਡੇਟਾ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਬਟਨ ਨੂੰ ਦਬਾਉ ਜਾਂ ਡੇਟਾਸੇਟ ਤੋਂ ਡਾਟਾ ਹਟਾਉਣ ਲਈ, ਜਾਂ ਸਾਰਾ ਡੇਟਾਸੇਟ ਮਿਟਾਉਣ ਲਈ. ਡੇਟਾਸੇਟ ਵੱਖੋ ਵੱਖਰੇ ਮਾਪਦੰਡਾਂ ਨੂੰ ਡੇਟਾ ਤੇ ਲਾਗੂ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਅਜਿਹਾ ਕਰਨ ਲਈ ਉਪਰੋਂ ਲੋੜੀਂਦੀ ਕਾਰਵਾਈ ਦੀ ਚੋਣ ਕਰੋ ਅਤੇ ਫਿਰ ਮਾਪਦੰਡਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ਲਈ ਸੰਬੰਧਿਤ ਕਾਲਮ ਤੇ ਕਲਿਕ ਕਰੋ. ਜੇ ਤੁਸੀਂ ਮਾਪਦੰਡ ਸ਼ਾਮਲ ਕਰਨ ਵਿੱਚ ਕੋਈ ਗਲਤੀ ਕਰਦੇ ਹੋ ਤਾਂ ਸਿਰਫ ਕਲਿੱਕ ਕਰੋ ਬਟਨ ਨੂੰ.

ਇੱਥੇ ਵੱਖ ਵੱਖ ਮਾਪਦੰਡ ਦੀਆਂ ਕਿਸਮਾਂ ਦੀ ਸੂਚੀ ਹੈ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਕਿਵੇਂ ਵਰਤਣਾ ਹੈ:

ਜਦੋਂ ਤੁਸੀਂ ਉਪਰੋਕਤ ਓਪਰੇਸ਼ਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਦੀ ਚੋਣ ਕੀਤੀ ਹੈ ਜੇ ਇਹ ਮਲਟੀਪਲ ਕਾਲਮਾਂ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰ ਸਕਦੀ ਹੈ ਤਾਂ ਇਹ ਤੁਹਾਨੂੰ ਪੁੱਛੇਗਾ ਕਿ ਕੀ ਤੁਸੀਂ ਇਸ ਨੂੰ ਸਿਰਫ ਕਾਲਮਾਂ ਦੇ ਸਬਸੈੱਟ ਜਾਂ ਉਨ੍ਹਾਂ ਸਾਰਿਆਂ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰਨ ਦੇਣਾ ਚਾਹੁੰਦੇ ਹੋ. ਜ਼ਿਆਦਾਤਰ ਮਾਮਲਿਆਂ ਵਿੱਚ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਇਹ ਸਾਰੇ ਕਾਲਮਾਂ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰੇ, ਹਾਲਾਂਕਿ ਕੁਝ ਹਾਲਤਾਂ ਵਿੱਚ ਇਹ ਪ੍ਰਭਾਵਿਤ ਕਾਲਮਾਂ ਨੂੰ ਸੀਮਤ ਕਰਨਾ ਲਾਭਦਾਇਕ ਹੈ. ਉਦਾਹਰਣ ਦੇ ਲਈ, ਜੇ ਤੁਸੀਂ ਇੱਕ ਲੜੀ ਦੀ ਚੋਣ ਕਰ ਰਹੇ ਹੋ ਲੇਬਲ ਅਤੇ ਮੁੱਲਹੈ, ਜੋ ਕਿ ਵੈੱਬ ਪੰਨਿਆਂ ਤੇ ਸਥਿਤੀ ਬਦਲਦਾ ਹੈ ਤੁਸੀਂ ਸਾਰੇ ਲੇਬਲ ਅਤੇ ਮੁੱਲ ਚੁਣ ਸਕਦੇ ਹੋ. ਫਿਰ ਡੈਟਾਸੇਟ ਵਿਚ ਇਸ ਨੂੰ ਲੋੜੀਂਦੇ ਲੇਬਲ ਤਕ ਸੀਮਤ ਕਰਨ ਲਈ ਬਰਾਬਰ ਦੀ ਕਾਰਵਾਈ ਦੀ ਵਰਤੋਂ ਕਰੋ ਅਤੇ ਨਿਸ਼ਚਤ ਕਰੋ ਕਿ ਸਿਰਫ ਲੇਬਲ ਅਤੇ ਮੁੱਲ ਕਾਲਮ ਪ੍ਰਭਾਵਿਤ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ. ਇਹ ਯਕੀਨੀ ਬਣਾਏਗਾ ਕਿ ਦੂਸਰੇ ਕਾਲਮ ਕਤਾਰਾਂ ਨੂੰ ਮਿਟਾਉਣ ਨਾਲ ਪ੍ਰਭਾਵਿਤ ਨਹੀਂ ਹੋਣਗੇ, ਸੰਪੂਰਨਤਾ ਲਈ ਇਹ ਲੇਬਲ ਕਾਲਮ ਨੂੰ ਲੁਕਾਉਣਾ ਲਾਭਦਾਇਕ ਹੋਵੇਗਾ.

ਇੱਕ ਵਾਰ ਜਦੋਂ ਤੁਸੀਂ ਉਹ ਸਭ ਕੁਝ ਸੰਸ਼ੋਧਿਤ ਕਰ ਲੈਂਦੇ ਹੋ ਜੋ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ, ਕਲਿੱਕ ਕਰੋ ਅਗਲਾ ਅਤੇ, ਤੁਹਾਡੀਆਂ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਸਕ੍ਰੈਪ ਵਿੱਚ ਜੋੜਿਆ ਜਾਵੇਗਾ. ਜੇ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਤੁਹਾਡੇ ਕੋਲ ਹੋਰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਜੋੜਨ ਦਾ ਵਿਕਲਪ ਹੈ.

ਇੱਕ ਵੈੱਬਪੇਜ ਨੂੰ ਸੋਧਣਾ

ਵੈੱਬਪੇਜ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਇਸ ਨੂੰ ਹੇਰਾਫੇਰੀ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਕਲਿੱਕ, ਟਾਈਪ ਕਰਕੇ ਅਤੇ ਡਰਾਪ ਡਾਉਨਜ਼ ਤੋਂ ਮੁੱਲ ਚੁਣ ਕੇ. ਇਹ ਯਾਦ ਰੱਖਣਾ ਮਹੱਤਵਪੂਰਣ ਹੈ ਕਿ ਹਾਲਾਂਕਿ ਇਹ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਲੋਡ ਕਰਨ ਲਈ ਇੱਕ ਨਵਾਂ ਵੈਬਪੰਨੇ ਦਾ ਕਾਰਨ ਬਣ ਸਕਦਾ ਹੈ ਜਦੋਂ ਤੱਕ ਸਾਰੀਆਂ ਲਾਗੂ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਲਾਗੂ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ.

ਇੱਕ ਵੈੱਬਪੇਜ ਨੂੰ ਹੇਰਾਫੇਰੀ ਲਈ ਜਾਂ ਤਾਂ ਚੁਣੋ ਕਲਿਕ ਐਲੀਮੈਂਟ, ਹੋਵਰ ਐਲੀਮੈਂਟ, ੋਲ ਕਰੋ, ਟੈਕਸਟ ਟਾਈਪ ਕਰੋ or ਡ੍ਰੌਪ ਡਾਉਨ ਲਿਸਟ ਵੈਲਯੂ ਦੀ ਚੋਣ ਕਰੋ ਕਾਰਵਾਈਆਂ. ਜੇ ਤੁਸੀਂ ਇੱਕ ਕਲਿਕ ਐਕਸ਼ਨ ਕਰ ਰਹੇ ਹੋ ਤਾਂ ਤੁਸੀਂ ਵੈਬਪੰਨੇ ਤੇ ਬਹੁਤ ਸਾਰੇ ਤੱਤਾਂ ਤੇ ਕਲਿਕ ਕਰ ਸਕਦੇ ਹੋ. ਨਹੀਂ ਤਾਂ ਤੁਹਾਨੂੰ ਇੱਕ ਉੱਚਿਤ HTML ਐਲੀਮੈਂਟ ਚੁਣਨਾ ਚਾਹੀਦਾ ਹੈ, ਉਦਾਹਰਣ ਲਈ ਟੈਕਸਟ ਬਾਕਸ ਵਿੱਚ ਟਾਈਪ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ. ਫਿਰ ਕਲਿੱਕ ਕਰੋ ਅਗਲਾ. ਇਹ ਇੱਕ ਵਿਕਲਪ ਬਾਕਸ ਖੋਲ੍ਹ ਦੇਵੇਗਾ ਜੋ ਤੁਹਾਨੂੰ ਕਾਰਵਾਈ ਨੂੰ ਪੂਰਾ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ. ਜਦੋਂ ਟੈਕਸਟ ਟਾਈਪ ਕਰਨਾ ਅਤੇ ਡਰਾਪ ਡਾ fromਨ ਵਿੱਚੋਂ ਡਾਟੇ ਨੂੰ ਚੁਣਨਾ ਜਾਂ ਟਾਈਪ ਕਰਨਾ ਜਾਂ ਚੁਣਨਾ ਹੋਵੇ ਤਾਂ ਕ੍ਰਮਵਾਰ ਚੁਣਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ. ਇਸ ਤੋਂ ਇਲਾਵਾ ਤਿੰਨੋਂ ਕਾਰਜਾਂ ਲਈ ਵਿਕਲਪ ਇਕੋ ਜਿਹੇ ਹਨ.

ਜੇ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਤੁਸੀਂ ਟੈਂਪਲੇਟ ਦੀ ਚੋਣ ਕਰ ਸਕਦੇ ਹੋ ਤਾਂ ਇਸ ਕਾਰਵਾਈ ਨੂੰ ਚਲਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਕਲਿੱਕ ਐਕਸ਼ਨ ਲਈ ਜੋ ਟੈਪਲੇਟ ਲਾਗੂ ਹੁੰਦਾ ਹੈ, ਇੱਕ ਵਾਰ ਕਲਿੱਕ ਐਕਸ਼ਨ ਪੂਰਾ ਹੋਣ 'ਤੇ. ਹਾਲਾਂਕਿ, ਇੱਕ ਕਲਿਕ ਐਕਸ਼ਨ ਨੂੰ ਇੱਕ ਨਵਾਂ ਟੈਂਪਲੇਟ ਨਿਰਧਾਰਤ ਕਰਨਾ ਜੋ ਇੱਕੋ ਪੰਨੇ ਤੇ ਮਲਟੀਪਲ ਕਲਿਕਸ ਕਰਦਾ ਹੈ, ਇਹ ਚੰਗਾ ਵਿਚਾਰ ਨਹੀਂ ਹੈ, ਜਿਵੇਂ ਕਿ ਇਨਲਾਈਨ ਪੌਪਅਪ ਖੋਲ੍ਹਣਾ ਜਾਂ ਚੀਜ਼ਾਂ ਨੂੰ ਸਕ੍ਰੀਨ ਤੇ ਪ੍ਰਦਰਸ਼ਤ ਕਰਨਾ. ਇਹ ਇਸ ਲਈ ਕਿਉਂਕਿ ਜੇ ਕਲਿਕ ਐਕਸ਼ਨ ਸਿਰਫ ਕੁਝ ਟੈਂਪਲੇਟਾਂ ਤੇ ਚੱਲਦੀ ਹੈ, ਤਾਂ ਪਹਿਲੇ ਕਲਿਕ ਦੁਆਰਾ ਨਿਰਧਾਰਤ ਕੀਤਾ ਗਿਆ ਨਵਾਂ ਟੈਂਪਲੇਟ ਰੀਸੈਟ ਨਹੀਂ ਕੀਤਾ ਜਾਏਗਾ ਅਤੇ ਇਸ ਲਈ ਇਸ ਅਧਾਰ ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ ਕਿ ਸਕ੍ਰੈਪ ਕਿਵੇਂ ਲਿਖਿਆ ਗਿਆ ਸੀ ਉਸੇ ਪੰਨੇ ਤੇ ਆਉਣ ਵਾਲੀਆਂ ਕਲਿਕਾਂ ਨੂੰ ਚਲਾਉਣ ਤੋਂ ਰੋਕ ਸਕਦਾ ਹੈ. ਤੁਸੀਂ ਇਹ ਵੀ ਪਰਿਭਾਸ਼ਤ ਕਰ ਸਕਦੇ ਹੋ ਜੇ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਇਸ ਕਿਰਿਆ ਨੂੰ ਸਿਰਫ ਇਕ ਵਾਰ ਚਲਾਇਆ ਜਾਵੇ, ਇਹ ਲਾਭਦਾਇਕ ਹੈ ਜੇ ਤੁਸੀਂ ਲੌਗਇਨ ਵਰਗੇ ਕੁਝ ਕਰ ਰਹੇ ਹੋ intਓਏ ਵੈਬਸਾਈਟ.

ਟਾਈਪ ਟੈਕਸਟ ਜਾਂ ਸਿਲੈਕਟ ਡ੍ਰੌਪ ਡਾਉਨ ਲਿਸਟ ਵੈਲਯੂ ਐਕਸ਼ਨ ਤੁਹਾਨੂੰ ਕ੍ਰਮਵਾਰ ਟੈਕਸਟ ਦੀਆਂ ਕਈ ਆਈਟਮਾਂ ਟਾਈਪ ਕਰਨ ਜਾਂ ਮਲਟੀਪਲ ਸਿਲੈਕਟ ਬਾਕਸ ਸਿਲੈਕਸ਼ਨ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀਆਂ ਹਨ. ਇਨ੍ਹਾਂ ਨੂੰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ 'ਤੇ ਕਲਿਕ ਕਰਕੇ ਸੰਪਾਦਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਪਰਿਵਰਤਨ ਬਦਲੋ ਜਾਂ ਵੇਖੋ ਬਟਨ, ਜਿਵੇਂ ਕਿ ਸਕਰੀਨ ਸ਼ਾਟ ਵਿੱਚ ਖੱਬੇ ਪਾਸੇ ਵੇਖਾਇਆ ਗਿਆ ਹੈ.

ਇਹ ਮਹੱਤਵਪੂਰਣ ਹੋ ਸਕਦਾ ਹੈ ਜੇ ਤੁਸੀਂ ਕਿਸੇ ਖੋਜ ਬਕਸੇ ਵਿੱਚ ਨਾਮਾਂ ਦੀ ਇੱਕ ਸੂਚੀ ਟਾਈਪ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ. ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰਨ ਲਈ ਕਿ ਫਾਰਮ ਨੂੰ ਸਿਰਫ ਉਦੋਂ ਜਮ੍ਹਾ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ ਜਦੋਂ ਖੋਜ ਬਾਕਸ ਵਿੱਚ ਇੱਕ ਮੁੱਲ ਹੁੰਦਾ ਹੈ ਹਰ ਵਾਰ ਟੈਕਸਟ ਨੂੰ ਸਫਲਤਾਪੂਰਵਕ ਟਾਈਪ ਕਰਨ ਸਮੇਂ ਇੱਕ ਟੈਂਪਲੇਟ ਸੈਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ into ਟੈਕਸਟਬਾਕਸ ਅਤੇ ਇੱਕ ਬਟਨ 'ਤੇ ਕਲਿੱਕ ਕਿਰਿਆ ਨਹੀਂ ਕੀਤੀ ਜਾਂਦੀ ਜਦੋਂ ਤੱਕ ਇਹ ਟੈਂਪਲੇਟ ਸੈਟ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ. ਕਲਿਕ ਐਕਸ਼ਨ ਦੇ ਪੂਰਾ ਹੋਣ ਤੋਂ ਬਾਅਦ ਵਿਧੀ ਨੂੰ ਰੀਸੈਟ ਕਰਨ ਲਈ ਨਮੂਨੇ ਨੂੰ ਫਿਰ ਕਿਸੇ ਹੋਰ ਚੀਜ਼ ਵਿੱਚ ਬਦਲਣ ਦੀ ਜ਼ਰੂਰਤ ਹੋਏਗੀ.

ਵੈਬਸਾਈਟਾਂ ਤੇ ਹੇਰਾਫੇਰੀ ਕਰਨ ਵਾਲੀਆਂ ਕ੍ਰਿਆਵਾਂ ਤੋਂ ਬਾਅਦ, ਕੁਝ ਸਮੇਂ ਲਈ ਇੰਤਜ਼ਾਰ ਕਰਨਾ ਲਾਭਦਾਇਕ ਹੁੰਦਾ ਹੈ ਜੇ ਕਾਰਵਾਈਆਂ ਏਜੇਐਕਸ ਕਾਰਜਕੁਸ਼ਲਤਾ ਦੀ ਸ਼ੁਰੂਆਤ ਕਰਦੀਆਂ ਹਨ, ਤਾਂ ਕਿ ਖੁਰਲੀ ਨੂੰ ਜਾਰੀ ਰੱਖਣ ਤੋਂ ਪਹਿਲਾਂ ਏਜੇਕਸ ਸਮੱਗਰੀ ਨੂੰ ਲੋਡ ਹੋਣ ਦਿੱਤਾ ਜਾਏ. ਤੁਸੀਂ ਇਸ ਵਿੱਚ ਦੇਰੀ ਸ਼ਾਮਲ ਕਰਕੇ ਕਰ ਸਕਦੇ ਹੋ ਐਗਜ਼ੀਕਿ .ਸ਼ਨ ਦੇ ਬਾਅਦ ਇੰਤਜ਼ਾਰ ਕਰੋ ਪਾਠ ਬਕਸਾ.

ਇਕ ਵਾਰ ਕਿਸੇ ਸ਼ਰਤ ਦੀ ਪੂਰਤੀ ਹੋਣ 'ਤੇ ਤੁਸੀਂ ਸਿੱਧਾ ਵੱਖਰੇ ਯੂਆਰਐਲ' ਤੇ ਜਾਣਾ ਚਾਹੁੰਦੇ ਹੋ. ਇਹ ਕਰਨ ਲਈ URL ਤੇ ਜਾਓ ਕਿਰਿਆ, ਜੋ ਸਿਰਫ ਤਾਂ ਹੀ ਪ੍ਰਦਰਸ਼ਿਤ ਹੋਣਗੇ ਜਦੋਂ ਘੱਟੋ ਘੱਟ ਇੱਕ ਟੈਂਪਲੇਟ ਨੂੰ ਸਕ੍ਰੈਪ ਵਿੱਚ ਪ੍ਰਭਾਸ਼ਿਤ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ ਜਦੋਂ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ ਤਾਂ ਇੱਕ ਟੈਂਪਲੇਟ ਨੂੰ ਨਿਰਧਾਰਤ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ, ਅਨੰਤ ਲੂਪਾਂ ਤੋਂ ਬਚਣ ਲਈ ਸਹਾਇਤਾ ਲਈ.

ਅੰਤ ਵਿੱਚ ਤੁਸੀਂ ਗਰੈਬਜ਼ਿਟ ਦੇ ਸਾਰੇ ਕੈਪਚਰ ਏਪੀਆਈ ਨੂੰ ਆਪਣੇ ਵੈੱਬ ਸਕ੍ਰੈਪਾਂ ਵਿੱਚ ਵਰਤ ਸਕਦੇ ਹੋ, ਬੱਸ ਕੈਪਚਰ ਵੈੱਬਪੇਜ ਦੀ ਚੋਣ ਕਰੋ ਅਤੇ ਆਪਣੀ ਲੋੜੀਦੀ ਕੈਪਚਰ ਦੀ ਚੋਣ ਕਰੋ. ਤੁਸੀਂ ਇਸ ਨੂੰ ਸੀਮਿਤ ਕਰ ਸਕਦੇ ਹੋ ਸਕ੍ਰਿਪ ਦੇ ਅੰਦਰ ਕੁਝ ਵੈਬ ਪੇਜਾਂ ਨੂੰ ਕੈਪਚਰ ਕਰਨ ਲਈ ਜਦੋਂ ਤੁਸੀਂ ਇੱਕ ਵਾਰ ਚੁਣਦੇ ਹੋ ਤਾਂ ਇਸ ਨੂੰ ਐਗਜ਼ੀਕਿਯੂਟ ਕਰਨ ਲਈ ਇੱਕ ਟੈਂਪਲੇਟ ਨਿਰਧਾਰਤ ਕਰਕੇ ਅਗਲਾ ਬਟਨ ਨੂੰ.

ਹਰ ਸਕ੍ਰੈਪ ਹਦਾਇਤਾਂ ਨੂੰ ਜੋੜਨ ਤੋਂ ਬਾਅਦ ਇਸ ਨੂੰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਨਿਰਦੇਸ਼ ਪੈਨਲ ਵਿੱਚ ਵੇਖਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਹਰ ਸਕ੍ਰੈਪ ਹਦਾਇਤ ਤੋਂ ਬਾਅਦ ਦਾ ਕਰਾਸ ਸਕ੍ਰੈਪ ਹਦਾਇਤਾਂ ਨੂੰ ਮਿਟਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ. ਜੇ ਇਕ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਹਟਾਇਆ ਜਾਂਦਾ ਹੈ ਜੋ ਕਿ ਹੋਰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਦੁਆਰਾ ਲੋੜੀਂਦਾ ਹੁੰਦਾ ਹੈ ਉਹ ਨਿਰਦੇਸ਼ ਵੀ ਮਿਟਾ ਦਿੱਤੇ ਜਾਂਦੇ ਹਨ. ਤੁਸੀਂ ਫੜੋ ਆਈਕਾਨ ਨਾਲ ਕਿਸੇ ਵੀ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਖਿੱਚ ਕੇ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਦਾ ਕ੍ਰਮ ਬਦਲ ਸਕਦੇ ਹੋ.

ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਹੱਥੀਂ ਲਿਖਣਾ

ਜੇ ਤੁਹਾਨੂੰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਵਧੇਰੇ ਖਾਸ customੰਗ ਨਾਲ ਅਨੁਕੂਲਿਤ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ ਤਾਂ ਤੁਹਾਨੂੰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਹੱਥੀਂ ਬਦਲਣਾ ਪਏਗਾ.

ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਨਿਰਦੇਸ਼ ਜਾਵਾ ਸਕ੍ਰਿਪਟ ਅਧਾਰਤ ਹਨ ਅਤੇ ਕੋਡ ਸੰਪਾਦਕ ਸੰਟੈਕਸ ਚੈਕਰ, ਆਟੋ ਪੂਰਨ ਅਤੇ ਟੂਲਟਿੱਪ ਦੇ ਨਾਲ ਸੰਪੂਰਨ ਆ ਜਾਂਦਾ ਹੈ ਤਾਂ ਜੋ ਇਸਨੂੰ ਸੰਭਵ ਹੋ ਸਕੇ ਸੌਖਾ ਬਣਾਇਆ ਜਾ ਸਕੇ.

ਵੈਬ ਸਕ੍ਰੈਪਰ ਨਿਰਦੇਸ਼ ਕੋਡ ਸੰਪਾਦਕ ਦੀ ਮੁੱਖ ਕਾਰਜਕੁਸ਼ਲਤਾ ਮੀਨੂ ਵਿਕਲਪਾਂ ਰਾਹੀਂ ਪਹੁੰਚਯੋਗ ਹੈ, ਜਿਵੇਂ ਕਿ ਸਕਰੀਨ ਸ਼ਾਟ ਵਿੱਚ ਦਿਖਾਇਆ ਗਿਆ ਹੈ, ਹਰੇਕ ਦਾ ਉਦੇਸ਼ ਹੇਠਾਂ ਵੱਖਰੇ ਤੌਰ ਤੇ ਦੱਸਿਆ ਗਿਆ ਹੈ. ਜਦੋਂ ਕਿ ਤੁਹਾਡੀਆਂ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਵਿੱਚ ਕੋਈ ਵੀ ਸੰਟੈਕਸ ਗਲਤੀਆਂ ਕੋਡ ਸੰਪਾਦਕ ਦੇ ਖੱਬੇ ਹੱਥ ਦੇ ਗਟਰ ਵਿੱਚ ਦਰਸਾਉਂਦੀਆਂ ਹਨ.

ਸਹਾਇਕ ਵਿਜ਼ਾਰਡ ਤੁਹਾਨੂੰ ਉਸ ਪੰਨੇ ਦੇ ਉਸ ਹਿੱਸੇ ਨੂੰ ਚੁਣਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਜਿਸ ਦੀ ਤੁਸੀਂ ਐਕਸਟਰੈਕਟ ਲੈਣੀ ਚਾਹੁੰਦੇ ਹੋ ਅਤੇ ਹੋਰ ਆਮ ਕੰਮ ਜਿਵੇਂ ਕਿ ਵੈੱਬ ਕੈਪਚਰ ਬਣਾਉਣਾ.

ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰੋ ਉਪਭੋਗਤਾ ਨੂੰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਨਿਰਦੇਸ਼ ਕੋਡ ਪ੍ਰਦਰਸ਼ਤ ਕਰਦਾ ਹੈ.

ਸਾਰੇ ਨਿਰਦੇਸ਼ ਮਿਟਾਓ ਸਾਰੇ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਮਿਟਾ ਦਿੰਦਾ ਹੈ.

ਵੈੱਬਪੇਜ ਫੰਕਸ਼ਨ ਪੇਜ ਕੀਵਰਡ ਦਾਖਲ ਕਰੇਗਾ into ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਅਤੇ ਆਟੋ-ਪੂਰਨ ਨੂੰ ਖੋਲ੍ਹੋ, ਜਿਸ ਵਿਚ ਸਭ ਸੰਭਵ ਹਨ ਪੇਜ ਫੰਕਸ਼ਨ. ਪੇਜ ਫੰਕਸ਼ਨ ਤੁਹਾਨੂੰ ਵੈੱਬ ਪੇਜ ਤੋਂ ਡੇਟਾ ਕੱractਣ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ.

ਡਾਟਾ ਫੰਕਸ਼ਨ ਡਾਟਾ ਕੀਵਰਡ ਦਾਖਲ ਕਰੇਗਾ into ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਡਾਟਾ ਫੰਕਸ਼ਨ ਤੁਹਾਨੂੰ ਇਜ਼ਾਜ਼ਤ save ਜਾਣਕਾਰੀ

ਨੈਵੀਗੇਸ਼ਨ ਫੰਕਸ਼ਨ ਨੇਵੀਗੇਸ਼ਨ ਕੀਵਰਡ ਵਿੱਚ ਦਾਖਲ ਹੋਇਆ intਕੋਡ ਸੰਪਾਦਕ The ਨੈਵੀਗੇਸ਼ਨ ਫੰਕਸ਼ਨ ਤੁਹਾਨੂੰ ਇਹ ਨਿਯੰਤਰਣ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਵੈੱਬ ਸਕ੍ਰੈਪਰ ਟੀਚੇ ਦੀ ਵੈਬਸਾਈਟ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਦਾ ਹੈ.

ਗਲੋਬਲ ਕਾਰਜ ਗਲੋਬਲ ਕੀਵਰਡ ਵਿੱਚ ਦਾਖਲ ਹੋਇਆ into ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਇਹ ਤੁਹਾਨੂੰ ਤੱਕ ਪਹੁੰਚ ਦਿੰਦਾ ਹੈ ਫੰਕਸ਼ਨ ਜੋ ਵੱਖੋ ਵੱਖਰੇ ਵੈਬ ਪੇਜਾਂ ਨੂੰ ਪਾਰਸ ਕਰਨ ਦੇ ਵਿਚਕਾਰ ਡਾਟਾ ਸਟੋਰ ਕਰ ਸਕਦਾ ਹੈ. ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਲਿਖਣ ਵੇਲੇ ਇਹ ਯਾਦ ਰੱਖਣਾ ਮਹੱਤਵਪੂਰਣ ਹੈ ਕਿ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਵਿੱਚ ਜਾਵਾ ਸਕ੍ਰਿਪਟ ਵੇਰੀਏਬਲ ਦੀ ਸਥਿਤੀ ਨਹੀਂ ਰੱਖੀ ਜਾਂਦੀ ਜਦੋਂ ਸਕ੍ਰੈਪਰ ਵੈਬ ਪੇਜਾਂ ਦੇ ਵਿਚਕਾਰ ਚਲਦੀ ਹੈ, ਜਦੋਂ ਤੱਕ ਤੁਸੀਂ ਗਲੋਬਲ ਫੰਕਸ਼ਨਾਂ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰਦੇ. save ਵੇਰੀਏਬਲਸ, ਜਿਵੇਂ ਕਿ ਹੇਠਾਂ ਦਰਸਾਇਆ ਗਿਆ ਹੈ.

Global.set("myvariable", "hello");
var mrvar = Global.get("myvariable");

ਹੇਠਾਂ ਦਰਸਾਏ ਅਨੁਸਾਰ, ਗਲੋਬਲ.ਸੈੱਟ ਵਿਧੀ ਵਿਚ ਸਥਿਰ ਪੈਰਾਮੀਟਰ ਦੇ ਸਹੀ ਤੇ ਸਥਿਰ ਗਲੋਬਲ ਵੇਰੀਏਬਲ ਪਾਸ ਨੂੰ ਬਣਾਉਣ ਲਈ.

Global.set("myvariable", "hello", true);

ਸਹੂਲਤ ਦੇ ਕੰਮ ਸਹੂਲਤ ਕੀਵਰਡ ਵਿੱਚ ਦਾਖਲ ਹੁੰਦਾ ਹੈ into ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਇਹ ਤੁਹਾਨੂੰ ਵਰਤਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਆਮ ਕਾਰਜ ਲਿਖਣਾ ਸਕ੍ਰੈਪਸ ਨੂੰ ਅਸਾਨ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਪੁੱਛਗਿੱਛ ਨੂੰ ਜੋੜਨਾ ਜਾਂ ਹਟਾਉਣਾstring ਯੂਆਰਐਲ ਤੋਂ ਪੈਰਾਮੀਟਰ.

ਮਾਪਦੰਡ ਕਾਰਜ ਮਾਪਦੰਡ ਕੀਵਰਡ ਵਿੱਚ ਦਾਖਲ ਹੁੰਦਾ ਹੈ into ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਇਹ ਫੰਕਸ਼ਨ ਤੁਹਾਨੂੰ ਤੁਹਾਡੇ ਸਕ੍ਰੈਪ ਦੇ ਦੌਰਾਨ ਕੱ .ੇ ਗਏ ਡੇਟਾ ਨੂੰ ਸੁਧਾਰੀ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਡੁਪਲਿਕੇਟ ਨੂੰ ਖਤਮ ਕਰਨਾ.

ਫਿਲਟਰ ਤੁਹਾਨੂੰ ਆਸਾਨੀ ਨਾਲ ਫਿਲਟਰ ਬਣਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਇਸ ਨੂੰ ਕੁਝ ਫੰਕਸ਼ਨਾਂ ਦੁਆਰਾ ਇੱਕ ਵੈੱਬ ਪੇਜ ਦੇ ਅੰਦਰੋਂ ਕਿਸੇ ਖ਼ਾਸ HTML ਤੱਤ ਦੀ ਚੋਣ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੁੰਦੀ ਹੈ. ਸਿਰਫ਼ ਉਹ ਗੁਣ ਚੁਣੋ ਜੋ ਤੁਹਾਡੇ ਨਿਸ਼ਾਨਾ ਤੱਤ ਵਿੱਚ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ ਅਤੇ / ਜਾਂ ਤੱਤ ਦੇ ਮਾਪਿਆਂ ਨੂੰ ਉਹ ਤੱਤ ਚੁਣਨਾ ਚਾਹੀਦਾ ਹੈ. ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰੋ ਕਿ ਇਸ ਵਿਕਲਪ ਤੇ ਕਲਿਕ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਤੁਹਾਡਾ ਕਰਸਰ ਫਿਲਟਰ ਨੂੰ ਵੀ ਪਾਸ ਕਰਨ ਲਈ ਫੰਕਸ਼ਨ ਵਿਚ ਸਹੀ ਜਗ੍ਹਾ ਤੇ ਹੈ.

ਸਕਰੀਨ ਸ਼ਾਟ ਦੇ ਕੰਮ ਤੁਹਾਨੂੰ ਸਕਰੀਨਸ਼ਾਟ ਵਿਕਲਪ ਸੈਟ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ. ਟੂਲ-ਟਿੱਪ ਦੁਆਰਾ ਪਛਾਣੀ ਗਈ ਅਤੇ ਸਕ੍ਰੀਨਸ਼ਾਟ ਵਿਕਲਪਾਂ ਨੂੰ ਦਬਾਓ, ਫੰਕਸ਼ਨ ਦੇ ਸਹੀ ਹਿੱਸੇ ਵਿਚ ਕਰਸਰ ਨੂੰ ਸਿੱਧਾ ਰੱਖੋ. ਫਿਰ ਉਹ ਸਾਰੇ ਵਿਕਲਪ ਚੁਣੋ ਜੋ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਅਤੇ ਕਮਾਂਡ ਪਾਓ.

Strings

Stringਟੈਕਸਟ ਨੂੰ ਪ੍ਰਭਾਸ਼ਿਤ ਕਰਨ ਲਈ, ਵੈਬ ਸਕ੍ਰੈਪ ਕਰਨ ਵੇਲੇ, ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਵਿੱਚ ਵਰਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ. ਏ string ਡਬਲ ਦੁਆਰਾ ਸੀਮਿਤ ਕੀਤਾ ਗਿਆ ਹੈ (") ਜਾਂ ਇਕੱਲੇ ਹਵਾਲੇ ('). ਜੇ ਏ string ਇਹ ਇੱਕ ਡਬਲ ਹਵਾਲਾ ਨਾਲ ਸ਼ੁਰੂ ਕੀਤਾ ਗਿਆ ਹੈ, ਇਹ ਇੱਕ ਡਬਲ ਹਵਾਲਾ ਦੇ ਨਾਲ ਖਤਮ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, ਜੇ ਇੱਕ string ਇਕੋ ਹਵਾਲੇ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ ਇਹ ਇਕੋ ਹਵਾਲਾ ਦੇ ਨਾਲ ਖਤਮ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ. ਉਦਾਹਰਣ ਦੇ ਲਈ:

"my-class" ਅਤੇ 'my-class'

ਇਕ ਆਮ ਗਲਤੀ ਜਿਹੜੀ ਵਾਪਰ ਸਕਦੀ ਹੈ ਉਹ ਬੰਦ ਹੈ string ਗਲਤੀ, ਇਹ ਉਦੋਂ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਏ string ਉੱਪਰ ਇੱਕ ਬੰਦ ਹੋਣ ਵਾਲਾ ਹਵਾਲਾ ਨਹੀਂ ਹੈ ਜਾਂ ਵਿੱਚ ਇੱਕ ਲਾਈਨ ਬਰੇਕ ਹੈ string. ਹੇਠ ਦਿੱਤੇ ਗੈਰ ਕਾਨੂੰਨੀ ਹਨ strings:

"my
class"

"my class

ਇਸ ਅਸ਼ੁੱਧੀ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰਨਾ ਹੈ ਕਿ ਉਨ੍ਹਾਂ ਵਿਚ ਲਾਈਨ ਬਰੇਕਸ ਨਹੀਂ ਹਨ ਅਤੇ ਮੇਲ ਖਾਂਦੀਆਂ ਹਵਾਲੇ ਹਨ, ਜਿਵੇਂ ਕਿ:

"my class" ਅਤੇ "my class"

ਕਈ ਵਾਰ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਏ ਵਿੱਚ ਇੱਕ ਸਿੰਗਲ ਜਾਂ ਡਬਲ ਕੋਟ ਦਿਖਾਈ ਦੇਵੇ string. ਅਜਿਹਾ ਕਰਨ ਦਾ ਸਭ ਤੋਂ ਅਸਾਨ ਤਰੀਕਾ ਹੈ ਕਿ ਏ ਵਿਚ ਇਕੋ ਹਵਾਲਾ ਪਾਓ string ਡਬਲ ਕੋਟਸ ਅਤੇ ਏ ਵਿੱਚ ਇੱਕ ਡਬਲ ਹਵਾਲੇ ਨਾਲ ਸੀਮਾਂਤ ਕੀਤਾ string ਇਕੱਲੇ ਹਵਾਲਿਆਂ ਨਾਲ ਸੀਮਾਂਤ, ਜਿਵੇਂ ਕਿ:

"Bob's shop" ਅਤੇ '"The best store on the web"'

ਵਿਕਲਪਿਕ ਤੌਰ ਤੇ ਤੁਸੀਂ ਇਸ ਤਰਾਂ ਦੇ ਹਵਾਲੇ ਤੋਂ ਬਚਣ ਲਈ ਬੈਕਸਲੈਸ਼ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹੋ:

'test\'s'

ਸਧਾਰਣ ਮੈਨੂਅਲ ਸਕੈਰੇਪ ਟਾਸਕ

ਲਿੰਕ ਚੈਕਰ ਇੱਕ ਕਸਟਮ ਲਿੰਕ ਚੈਕਰ ਬਣਾਓ - ਇਹਨਾਂ ਸਧਾਰਣ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਕੇ ਇੱਕ ਕਸਟਮ ਲਿੰਕ ਚੈਕਰ ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ ਇਸਦਾ ਪਤਾ ਲਗਾਓ.
ਚਿੱਤਰ ਡਾ Downloadਨਲੋਡ ਇਕ ਵੈੱਬਸਾਈਟ ਤੋਂ ਸਾਰੀਆਂ ਤਸਵੀਰਾਂ ਡਾ .ਨਲੋਡ ਕਰੋ - ਪੂਰੀ ਵੈਬਸਾਈਟ ਤੋਂ ਸਾਰੀਆਂ ਤਸਵੀਰਾਂ ਨੂੰ ਡਾ downloadਨਲੋਡ ਕਰਨ ਬਾਰੇ ਪਤਾ ਲਗਾਓ.
ਡਾਟਾਸੇਟ ਬਣਾਓ ਡਾਟਾ ਕੱ Extੋ ਅਤੇ ਇਸ ਨੂੰ ਬਦਲ ਦਿਓ intਓਏ ਡਾਟਸੇਟ - ਇਹ ਪਤਾ ਲਗਾਓ ਕਿ ਜਿਸ ਵੈਬਸਾਈਟ ਤੋਂ ਤੁਸੀਂ ਸਕ੍ਰੈਪ ਕਰ ਰਹੇ ਹੋ ਉਸ ਤੋਂ ਡੇਟਾਸੇਟ ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ.
ਲਿੰਕ ਐਕਸਟਰੈਕਟ ਕਰੋ ਕਿਸੇ ਵੈਬਸਾਈਟ ਤੋਂ ਲਿੰਕ ਐਕਸਟਰੈਕਟ ਕਰੋ - ਪੂਰੀ ਵੈਬਸਾਈਟ ਤੋਂ ਸਾਰੇ HTML ਲਿੰਕਾਂ ਨੂੰ ਕਿਵੇਂ ਕੱ toਣਾ ਹੈ ਅਤੇ save ਉਹ ਫਾਰਮੈਟ ਵਿੱਚ ਜੋ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ.
ਟੈਕਸਟ ਚੁਣੋ ਪੈਟਰਨ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਟੈਕਸਟ ਤੋਂ ਮੁੱਲ ਕੱractਣਾ - ਇਹ ਪਤਾ ਲਗਾਓ ਕਿ ਟੈਕਸਟ ਦੇ ਬਲਾਕਾਂ ਤੋਂ ਮੁੱਲ ਕੱractਣ ਲਈ ਪੈਟਰਨ ਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕੀਤੀ ਜਾਵੇ.
OCR ਚਿੱਤਰਾਂ ਤੋਂ ਟੈਕਸਟ ਕੱ Extੋ - ਚਿੱਤਰਾਂ ਵਿਚਲੇ ਪਾਠ ਨੂੰ ਕਿਵੇਂ ਕੱractਣਾ ਹੈ ਬਾਰੇ ਜਾਣੋ.
ਡਾਟਾਸੈਟ ਡੇਟਾਸੇਟ ਨੂੰ ਕਿਵੇਂ ਪਡ ਕਰਨਾ ਹੈ - ਪੈਡਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ ਕੱractedੇ ਗਏ ਡੇਟਾ ਨੂੰ ਵਧੀਆ formatੰਗ ਨਾਲ ਫਾਰਮੈਟ ਕਰੋ.
ਅਰੇ ਐਰੇ ਨੂੰ ਹੇਰਾਫੇਰੀ ਵਿੱਚ ਲਿਆਉਣਾ - ਇਹ ਪਤਾ ਲਗਾਓ ਕਿ ਸਕੈਰੇਪਾਂ ਵਿੱਚ ਐਰੇ ਨੂੰ ਅਸਾਨੀ ਨਾਲ ਸੰਭਾਲਣ ਲਈ ਵਿਸ਼ੇਸ਼ ਐਰੇ ਸਹੂਲਤ ਵਿਧੀਆਂ ਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕੀਤੀ ਜਾਵੇ.
ਐਕਸ਼ਨ ਸਕ੍ਰੈਪ ਦੇ ਦੌਰਾਨ ਸਿਰਫ ਇੱਕ ਵਾਰ ਕਿਰਿਆ ਕਰੋ - ਇਹ ਪਤਾ ਲਗਾਓ ਕਿ ਪੂਰੇ ਖੁਰਲ ਦੇ ਦੌਰਾਨ ਸਿਰਫ ਇੱਕ ਵਾਰ ਕਿਰਿਆ ਕਿਵੇਂ ਕੀਤੀ ਜਾਵੇ.
ਸੁਧਾਰੋ ਸਕ੍ਰੈਪਡ ਡੇਟਾ ਨੂੰ ਸੁਧਾਰੀ ਜਾ ਰਿਹਾ ਹੈ - ਆਪਣੇ ਸਕ੍ਰੈਪਸ ਤੋਂ ਗੈਰ-ਲੋੜੀਂਦਾ ਡੇਟਾ ਨੂੰ ਕਿਵੇਂ ਕੱ toਣਾ ਹੈ ਬਾਰੇ ਖੋਜ ਕਰੋ.
ਈਮੇਲ ਪਤਾ ਕਿਸੇ ਵੈਬਸਾਈਟ ਦੇ ਈਮੇਲ ਪਤਿਆਂ ਨੂੰ ਖਤਮ ਕਰੋ - ਇਹ ਪਤਾ ਲਗਾਓ ਕਿ ਕਿਸੇ ਵੈਬਸਾਈਟ ਤੋਂ ਸਾਰੇ ਈਮੇਲ ਪਤਿਆਂ ਨੂੰ ਕਿਵੇਂ ਖਤਮ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ.
ਸਕਰੀਨ ਸਕਰੀਨ ਸ਼ਾਟ ਪੂਰੀ ਵੈਬਸਾਈਟ into ਪੀਡੀਐਫ ਜਾਂ ਚਿੱਤਰ - ਪੂਰੀ ਵੈਬਸਾਈਟ ਦੇ ਹਰ ਪੰਨੇ ਨੂੰ ਕੈਪਚਰ ਕਰਨ ਲਈ ਗਰੈਬਜ਼ਟ ਵੈੱਬ ਸਕ੍ਰੈਪਰ ਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕਰੀਏ ਬਾਰੇ ਜਾਣੋ.
ਸਕਰੀਨ ਗੈਰ ਸੰਗਠਿਤ ਪਾਠ ਤੋਂ structਾਂਚਾਗਤ ਜਾਣਕਾਰੀ ਨੂੰ ਐਕਸਟਰੈਕਟ ਕਰੋ - ਭਾਵਨਾਵਾਂ, ਨਾਮ, ਸਥਾਨ ਅਤੇ ਸੰਸਥਾਵਾਂ ਕੱractਣ ਲਈ ਗਰੈਬਜ਼ਿਟ ਦੀ ਵਰਤੋਂ ਕਰੋ.

HTML ਤੋਂ ਇਲਾਵਾ ਸਮਗਰੀ ਨੂੰ ਸਕ੍ਰੈਪਿੰਗ ਕਰਨਾ

ਜਦੋਂ ਵੈੱਬ ਸਕ੍ਰੈਪਰ ਪੀਡੀਐਫ, ਐਕਸਐਮਐਲ, ਜੇਐਸਐਨ ਅਤੇ ਆਰਐਸਐਸ ਦੇ ਪਾਰ ਆਉਂਦੀ ਹੈ ਤਾਂ ਇਹ ਇਸ ਨੂੰ ਇੱਕ HTML ਅਨੁਮਾਨ ਵਿੱਚ ਬਦਲ ਦੇਵੇਗਾ, ਜੋ ਸਾਡੀ ਵੈਬ ਸਕ੍ਰੈਪਰ ਨੂੰ ਸਹੀ pੰਗ ਨਾਲ ਪਾਰਸ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਅਤੇ ਤੁਹਾਨੂੰ ਉਹ ਸਮਗਰੀ ਚੁਣਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਕੱractਣਾ ਚਾਹੁੰਦੇ ਹੋ. ਉਦਾਹਰਣ ਦੇ ਲਈ, ਜੇ ਤੁਸੀਂ JSON ਡੇਟਾ ਨੂੰ ਪਾਰਸ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਇਹ ਡੇਟਾ ਨੂੰ ਬਦਲ ਦੇਵੇਗਾ intਜਿਵੇਂ ਕਿ ਸਾਈਡ ਨੂੰ ਦਿਖਾਇਆ ਗਿਆ ਹੈ ਦੇ ਰੂਪ ਵਿੱਚ HTML ਪ੍ਰਤੀਨਿਧਤਾ. ਇਹ ਤੁਹਾਨੂੰ ਆਮ ਵਾਂਗ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਬਣਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ.

ਇਸੇ ਤਰ੍ਹਾਂ ਜਦੋਂ ਸਕ੍ਰੈਪਰ ਇੱਕ ਪੀਡੀਐਫ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਲੋਡ ਕਰਦਾ ਹੈ, ਤਾਂ ਪੀਡੀਐਫ ਨੂੰ ਕਨਵਰਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ into ਚਿੱਤਰਾਂ, ਹਾਈਪਰਲਿੰਕਸ, ਟੈਕਸਟ ਅਤੇ ਟੇਬਲਾਂ ਨੂੰ ਚੁਣੇ ਜਾਣ ਅਤੇ ਖੁਰਚਣ ਦੀ ਆਗਿਆ ਦੇਣ ਲਈ HTML. ਹਾਲਾਂਕਿ ਜਿਵੇਂ ਕਿ ਪੀਡੀਐਫ ਦਾ ਅਸਲ structureਾਂਚਾ ਨਹੀਂ ਹੁੰਦਾ, ਟੇਬਲ ਦੀ ਪਛਾਣ ਹਾਇਰੋਸਟਿਕਸ ਦੀ ਵਰਤੋਂ ਕਰਦਿਆਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ ਇਸ ਤਰ੍ਹਾਂ ਹਮੇਸ਼ਾ ਸਹੀ ਨਹੀਂ ਹੁੰਦੇ.

ਨਿਰਯਾਤ ਚੋਣਾਂ

ਇਹ ਟੈਬ ਤੁਹਾਨੂੰ ਇਹ ਚੁਣਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ ਕਿ ਤੁਸੀਂ ਆਪਣੇ ਨਤੀਜੇ ਆਪਣੇ ਐਕਸਪੋਰਟ ਕਿਵੇਂ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਐਕਸਲ ਸਪਰੈਡਸ਼ੀਟ, ਐਕਸਐਮਐਲ, ਜੇਐਸਓਐਨ, ਸੀਐਸਵੀ, ਐਸਕਿQLਐਲ ਕਮਾਂਡਾਂ, ਜਾਂ HTML ਦਸਤਾਵੇਜ਼ਾਂ ਸਮੇਤ. ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਟੈਬ ਜ਼ਿਪਡ ਸਕ੍ਰੈਪ ਨਤੀਜਿਆਂ ਦਾ ਨਾਮ ਨਿਰਧਾਰਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ. ਜੇ ਤੁਸੀਂ ਸਿਰਫ ਫਾਈਲਾਂ ਨੂੰ ਡਾingਨਲੋਡ ਕਰ ਰਹੇ ਹੋ ਜਾਂ ਵੈਬ ਕੈਪਚਰ ਤਿਆਰ ਕਰ ਰਹੇ ਹੋ ਤਾਂ ਨਿਰਯਾਤ ਵਿਕਲਪ ਦੀ ਚੋਣ ਕਰਨ ਦੀ ਕੋਈ ਜ਼ਰੂਰਤ ਨਹੀਂ ਹੈ ਕਿਉਂਕਿ ਤੁਹਾਨੂੰ ਹੁਣੇ ਨਤੀਜਿਆਂ ਵਾਲੀ ਇੱਕ ਜ਼ਿਪ ਫਾਈਲ ਮਿਲੇਗੀ. ਇਹ ਟੈਬ ਤੁਹਾਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ ਕਿ ਤੁਸੀਂ ਨਤੀਜੇ ਕਿਵੇਂ ਭੇਜਣਾ ਚਾਹੁੰਦੇ ਹੋ. ਤੁਸੀਂ ਨਤੀਜੇ ਭੇਜ ਸਕਦੇ ਹੋ Amazon S3, ਡ੍ਰੌਪਬਾਕਸ, ਈਮੇਲ ਨੋਟੀਫਿਕੇਸ਼ਨ, FTP, ਅਤੇ ਵੈਬਡਾਵ.

ਅੰਤਮ ਵਿਕਲਪ ਇੱਕ ਕਾਲਬੈਕ ਯੂਆਰਐਲ ਹੈ, ਜੋ ਕਿ ਸਾਡੀ ਵਰਤੋਂ ਕਰਕੇ ਸਕ੍ਰੈਪ ਨਤੀਜਿਆਂ ਨੂੰ ਤੁਹਾਡੀ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਸਕ੍ਰੈਪ ਏਪੀਆਈ.

ਜ਼ਿਪਡ ਨਤੀਜਿਆਂ ਦਾ ਫਾਈਲ ਨਾਮ ਜਾਂ ਹਰੇਕ ਡਾਟਾ ਫਾਈਲ ਜੇ ਤੁਸੀਂ ਉਹਨਾਂ ਨੂੰ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਭੇਜਣ ਦੀ ਬੇਨਤੀ ਕਰਦੇ ਹੋ ਤਾਂ ਡਿਫਾਲਟ ਫਾਈਲ ਨਾਮ ਵਰਤੋ ਚੋਣ ਨੂੰ ਨਾ-ਜਾਂਚ ਕਰਕੇ ਅਤੇ ਆਪਣਾ ਲੋੜੀਂਦਾ ਫਾਈਲ ਨਾਮ ਸੈਟ ਕਰਕੇ ਸੈੱਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ. ਇਸਦੇ ਇਲਾਵਾ, ਇੱਕ ਟਾਈਮਸਟੈਂਪ ਪਾ ਕੇ ਤੁਹਾਡੇ ਫਾਈਲ ਨਾਮ ਵਿੱਚ ਜੋੜਿਆ ਜਾ ਸਕਦਾ ਹੈ {GrabzIt_Timestamp_UTC+1} ਫਾਈਲ ਨਾਮ ਵਿੱਚ. +1 UTC ਤੋਂ ਘੰਟਿਆਂ ਵਿੱਚ theਫਸੈੱਟ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ.

ਤੁਸੀਂ ਕਲਿਕ ਕਰਕੇ ਸਕ੍ਰੈਪ ਦੇ ਨਤੀਜੇ ਵੀ ਵੇਖ ਸਕਦੇ ਹੋ ਨਤੀਜੇ ਵੇਖੋ ਬਟਨ, ਅੱਗੇ ਤੁਹਾਡੀ ਖੁਰਕ, ਇਹ ਪਿਛਲੇ 48 ਘੰਟਿਆਂ ਦੇ ਅੰਦਰ ਕੀਤੇ ਗਏ ਕਿਸੇ ਵੀ ਅਸਲ-ਸਮੇਂ ਦੇ ਸਕ੍ਰੈਪ ਨਤੀਜੇ ਦਰਸਾਏਗਾ.

ਸਮਾਂ-ਤਹਿ ਸਕ੍ਰੈਪ

ਵੈੱਬ ਸਕ੍ਰੈਪ ਬਣਾਉਂਦੇ ਸਮੇਂ ਅਨੁਸੂਚੀ ਸਕ੍ਰੈਪ ਟੈਬ ਤੁਹਾਨੂੰ ਇਹ ਸੈੱਟ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੀ ਹੈ ਕਿ ਤੁਸੀਂ ਕਦੋਂ ਸਕ੍ਰੈਪ ਸ਼ੁਰੂ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਅਤੇ ਜੇਕਰ ਤੁਸੀਂ ਇਸਨੂੰ ਦੁਹਰਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਇਸਨੂੰ ਕਿੰਨੀ ਵਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਸਕ੍ਰੈਪ ਨੂੰ ਚਲਾਉਣ ਲਈ ਵੀ ਕੌਂਫਿਗਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜਦੋਂ ਕਿਸੇ ਵੈਬ ਪੇਜ 'ਤੇ ਤਬਦੀਲੀ ਦਾ ਪਤਾ ਲਗਾਇਆ ਜਾਂਦਾ ਹੈ। ਅਜਿਹਾ ਕਰਨ ਲਈ ਜਦੋਂ ਇੱਕ ਵੈਬ ਪੇਜ ਬਦਲਦਾ ਹੈ ਤਾਂ ਸ਼ੁਰੂ ਕਰੋ ਚੈੱਕਬਾਕਸ, ਫਿਰ ਮਾਨੀਟਰ ਕਰਨ ਲਈ ਵੈਬ ਪੇਜ ਦਾ URL ਦਰਜ ਕਰੋ, ਦੇ ਨਾਲ CSS ਚੋਣਕਾਰ ਪੰਨੇ ਦੇ ਉਸ ਹਿੱਸੇ ਦਾ ਜੋ ਤੁਸੀਂ ਹੋ interested in. ਇਹ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ ਪੰਨੇ ਦੇ ਇੱਕ ਛੋਟੇ ਜਿਹੇ ਹਿੱਸੇ ਨੂੰ ਅਣਉਚਿਤ ਤਬਦੀਲੀਆਂ ਕਾਰਨ ਗਲਤ ਸਕਾਰਾਤਮਕ ਤੋਂ ਬਚਣ ਲਈ ਚੁਣਿਆ ਗਿਆ ਹੈ।

ਨਿਗਰਾਨੀ ਅਤੇ ਡੀਬੱਗਿੰਗ ਸਕ੍ਰੈਪਸ

ਇੱਕ ਵਾਰ ਵੈਬ ਸਕ੍ਰੈਪ ਚਾਲੂ ਹੋਣ ਤੇ ਸਥਿਤੀ ਦਾ ਆਈਕਾਨ ਬਦਲ ਜਾਵੇਗਾ ਅਤੇ ਪ੍ਰੋਸੈਸਡ ਪੰਨੇ ਸਮੇਂ ਦੇ ਨਾਲ ਵਧਣਾ ਸ਼ੁਰੂ ਹੋ ਜਾਣਗੇ. ਸਕ੍ਰੈਪਸ ਦੀ ਪ੍ਰਗਤੀ ਦਾ ਇੱਕ ਅਸਲ ਸਮੇਂ ਦਾ ਸਨੈਪਸ਼ਾਟ ਨਿਯਮਿਤ ਤੌਰ ਤੇ ਇੱਕ ਲੌਗ ਫਾਈਲ ਦੇ ਨਾਲ ਤਿਆਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਅਤੇ ਪਿਛਲੇ ਵੈਬ ਪੇਜ ਦੇ ਨਿਯਮਤ ਸਕ੍ਰੀਨਸ਼ਾਟ ਦੇ ਨਾਲ ਜੋ ਸਕ੍ਰੈਪਰ ਦਾ ਸਾਹਮਣਾ ਕੀਤਾ ਹੈ. ਇਹ ਤੁਹਾਨੂੰ ਇਹ ਵੇਖਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਕਿ ਸਕ੍ਰੈਪ ਦੇ ਦੌਰਾਨ ਕੀ ਹੋ ਰਿਹਾ ਹੈ. ਇਸ ਜਾਣਕਾਰੀ ਨੂੰ ਲੱਭਣ ਲਈ, ਆਪਣੇ ਖੁਰਡੇ ਦੇ ਅਗਲੇ ਫੈਲਾਓ ਆਈਕਾਨ ਤੇ ਕਲਿੱਕ ਕਰੋ ਅਤੇ ਕਲਿੱਕ ਕਰੋ ਦਰਸ਼ਕ ਤੁਸੀਂ ਹੋ ਰਹੇ ਖੁਰਚਣ ਲਈ intਇਸਦਾ ਵੇਰਵਾ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ ਜੇ ਤੁਹਾਡੀ ਕੋਈ ਖਰਾਬੀ ਦੀਆਂ ਹਦਾਇਤਾਂ ਨਾਲ ਕੋਈ ਸਮੱਸਿਆ ਹੋਈ ਹੈ.

ਇੱਕ ਵਾਰੀ ਜਦੋਂ ਸਕ੍ਰੈਪ ਸਫਲਤਾਪੂਰਵਕ ਪੂਰਾ ਹੋ ਜਾਂਦਾ ਹੈ ਤਾਂ ਸਥਿਤੀ ਦਾ ਆਈਕਾਨ ਬਦਲ ਜਾਵੇਗਾ , ਜੇ ਦਰਸ਼ਕ ਖੋਲ੍ਹਣ ਨਾਲ ਕੋਈ ਨਤੀਜਾ ਨਹੀਂ ਹੁੰਦਾ ਤਾਂ ਲੌਗ ਅਤੇ ਆਖਰੀ ਸਕ੍ਰੀਨਸ਼ਾਟ ਤੁਹਾਨੂੰ ਦੱਸ ਸਕਦਾ ਹੈ ਕਿ ਕੀ ਗਲਤ ਹੋਇਆ ਹੈ.

ਲੌਗਜ਼ ਵਿੱਚ ਰਿਪੋਰਟ ਕੀਤੀ ਗਈ ਸਭ ਤੋਂ ਆਮ ਸਮੱਸਿਆਵਾਂ ਵਿੱਚੋਂ ਇੱਕ ਇਹ ਹੈ ਕਿ ਪੇਜ ਨੂੰ ਖੁਰਚਣ ਲਈ ਕਾਫ਼ੀ ਪੇਸ਼ਕਾਰੀ ਦੇਰੀ ਨਹੀਂ ਹੁੰਦੀ ਹੈ, ਅਕਸਰ ਇਸ ਵਿੱਚ ਇੱਕ ਛੋਟਾ ਜਿਹਾ ਵਾਧਾ ਹੁੰਦਾ ਹੈ. ਪੇਜ ਲੋਡ ਦੇਰੀ ਵਿੱਚ ਪਾਇਆ ਸਕ੍ਰੈਪ ਵਿਕਲਪ ਟੈਬ ਜ਼ਿਆਦਾਤਰ ਵੈਬਸਾਈਟਾਂ ਲਈ ਕਾਫ਼ੀ ਹੈ.