ਵੈੱਬ ਨੂੰ ਕੈਪਚਰ ਅਤੇ ਕਨਵਰਟ ਕਰਨ ਲਈ ਟੂਲ

ਇੱਕ ਵੈਬਸਾਈਟ ਅਤੇ ਇਸਦੀ ਸਮਗਰੀ ਨੂੰ ਕਿਵੇਂ ਡਾ downloadਨਲੋਡ ਕਰਨਾ ਹੈ?

ਦੀ ਵੈੱਬਸਾਈਟ

ਕੁਝ ਉਦਾਹਰਣ ਹੁੰਦੇ ਹਨ ਜਦੋਂ ਪੂਰੀ ਵੈਬਸਾਈਟ ਨੂੰ ਡਾ toਨਲੋਡ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦਾ ਹੈ, ਨਾ ਕਿ ਸਿਰਫ ਪੂਰਾ ਨਤੀਜਾ. ਪਰ HTML ਵੈੱਬ ਪੰਨੇ, ਸਰੋਤ ਜਿਵੇਂ ਕਿ CSS, ਸਕ੍ਰਿਪਟਾਂ ਅਤੇ ਚਿੱਤਰ.

ਇਹ ਇਸ ਲਈ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਤੁਸੀਂ ਕੋਡ ਦਾ ਬੈਕਅਪ ਚਾਹੁੰਦੇ ਹੋ ਪਰੰਤੂ ਹੁਣ ਕਿਸੇ ਕਾਰਨ ਕਰਕੇ ਅਸਲ ਸਰੋਤ ਤੇ ਨਹੀਂ ਜਾ ਸਕਦੇ. ਜਾਂ ਸ਼ਾਇਦ ਤੁਸੀਂ ਵਿਸਥਾਰਤ ਰਿਕਾਰਡ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਸਮੇਂ ਦੇ ਨਾਲ ਇੱਕ ਵੈਬਸਾਈਟ ਕਿਵੇਂ ਬਦਲ ਗਈ ਹੈ.

ਖੁਸ਼ਕਿਸਮਤੀ ਨਾਲ ਗਰੈਬਜ਼ ਆਈਟ ਦੀ ਵੈਬ ਸਕ੍ਰੈਪਰ ਇਕ ਵੈਬਸਾਈਟ ਦੇ ਸਾਰੇ ਵੈਬ ਪੇਜਾਂ ਤੇ ਘੁੰਮ ਕੇ ਇਸ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੀ ਹੈ. ਫਿਰ ਹਰੇਕ ਵੈਬ ਪੇਜ ਤੇ ਖੁਰਲੀ ਪੇਜ ਤੇ ਦਿੱਤੇ ਕਿਸੇ ਵੀ ਸਰੋਤਾਂ ਦੇ ਨਾਲ HTML ਨੂੰ ਡਾਉਨਲੋਡ ਕਰਦੀ ਹੈ.

ਪੂਰੀ ਵੈਬਸਾਈਟ ਨੂੰ ਡਾ Downloadਨਲੋਡ ਕਰਨ ਲਈ ਸਕ੍ਰੈਪ ਬਣਾਓ

ਆਪਣੀ ਵੈੱਬਸਾਈਟ ਨੂੰ ਡਾਉਨਲੋਡ ਕਰਨ ਲਈ ਜਿੰਨਾ ਸੰਭਵ ਹੋ ਸਕੇ ਗਰੈਬਜ਼ਿਟ ਇੱਕ ਸਕ੍ਰੈਪ ਟੈਂਪਲੇਟ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ.

ਸ਼ੁਰੂਆਤ ਕਰਨ ਲਈ ਇਸ ਨਮੂਨੇ ਨੂੰ ਲੋਡ ਕਰੋ.

ਫਿਰ ਆਪਣੇ ਦਿਓ ਟਾਰਗੇਟ URL, ਇਸ URL ਨੂੰ ਫਿਰ ਆਪਣੇ ਆਪ ਹੀ ਗਲਤੀਆਂ ਅਤੇ ਕਿਸੇ ਜ਼ਰੂਰੀ ਤਬਦੀਲੀਆਂ ਲਈ ਜਾਂਚ ਕੀਤੀ ਜਾਂਦੀ ਹੈ. ਰੱਖੋ ਸਵੈਚਲ ਰੂਪ ਵਿੱਚ ਸਕੈਰੇਪ ਚਾਲੂ ਕਰੋ ਚੈੱਕਬਾਕਸ ਟਿਕਿਆ ਹੋਇਆ ਹੈ, ਅਤੇ ਤੁਹਾਡਾ ਸਕ੍ਰੈਪ ਆਪਣੇ ਆਪ ਸ਼ੁਰੂ ਹੋ ਜਾਵੇਗਾ.

ਆਪਣੇ ਸਕ੍ਰੈਪ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰਨਾ

ਜੇ ਤੁਸੀਂ ਟੈਂਪਲੇਟ ਬਦਲਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਹਟਾ ਦਿਓ ਸਵੈਚਲ ਰੂਪ ਵਿੱਚ ਸਕੈਰੇਪ ਚਾਲੂ ਕਰੋ ਚੈੱਕਬਾਕਸ ਇੱਕ ਤਬਦੀਲੀ ਇੱਕ ਨਿਯਮਤ ਸੂਚੀ ਵਿੱਚ ਸਕ੍ਰੈਪ ਨੂੰ ਚਲਾਉਣਾ ਹੈ, ਉਦਾਹਰਣ ਲਈ, ਇੱਕ ਵੈਬਸਾਈਟ ਦੀਆਂ ਨਿਯਮਤ ਕਾਪੀਆਂ ਬਣਾਉਣੀਆਂ. ਦੇ ਉਤੇ ਸਮਾਂ-ਤਹਿ ਸਕ੍ਰੈਪ ਟੈਬ, ਬਸ ਕਲਿੱਕ ਕਰੋ ਮੁੜ ਦੁਹਰਾਓ ਚੈੱਕਬਾਕਸ ਅਤੇ ਫਿਰ ਚੁਣੋ ਕਿ ਤੁਸੀਂ ਕਿੰਨੀ ਵਾਰ ਸਕ੍ਰੈਪ ਦੁਹਰਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ. ਫਿਰ ਕਲਿੱਕ ਕਰੋ ਅੱਪਡੇਟ ਸਕ੍ਰੈਪ ਨੂੰ ਸ਼ੁਰੂ ਕਰਨ ਲਈ.

ਆਪਣੀ ਡਾਉਨਲੋਡ ਕੀਤੀ ਵੈੱਬਸਾਈਟ ਦੀ ਵਰਤੋਂ ਕਰਨਾ

ਸਕ੍ਰੈਪ ਖ਼ਤਮ ਹੋਣ ਤੋਂ ਬਾਅਦ ਤੁਹਾਨੂੰ ਇਕ ਜ਼ਿਪ ਫਾਈਲ ਮਿਲੇਗੀ. ਅਗਲੀ ਜ਼ਿਪ ਫਾਈਲ ਐਕਸਟਰੈਕਟ ਕਰੋ ਅਤੇ ਅੰਦਰ ਡਾਇਰੈਕਟਰੀ ਵਿੱਚ ਫਾਈਲਾਂ, ਜਿਸ ਨੂੰ ਡਾਉਨਲੋਡ ਕੀਤੇ ਸਾਰੇ ਵੈਬ ਪੇਜ ਅਤੇ ਵੈਬਸਾਈਟ ਸਰੋਤ ਹੋਣਗੇ. ਡਾਇਰੈਕਟਰੀ ਦੇ ਰੂਟ ਵਿਚ ਇਕ ਵਿਸ਼ੇਸ਼ HTML ਪੇਜ ਵੀ ਹੋਵੇਗਾ ਜਿਸ ਨੂੰ ਡੇਟਾ. Html ਕਹਿੰਦੇ ਹਨ. ਇਸ ਫਾਈਲ ਨੂੰ ਇੱਕ ਵੈੱਬ ਬਰਾ browserਜ਼ਰ ਵਿੱਚ ਖੋਲ੍ਹੋ ਅਤੇ ਤੁਹਾਨੂੰ ਤਿੰਨ ਕਾਲਮਾਂ ਦੇ ਨਾਲ ਇੱਕ HTML ਟੇਬਲ ਮਿਲੇਗਾ:

  • ਸਰੋਤ URL - ਇਹ ਉਹ URL ਹੈ ਜੋ ਵੈਬ ਸਕ੍ਰੈਪਰ ਨੂੰ ਸਰੋਤ ਮਿਲਿਆ. ਇਸ ਲਈ ਉਦਾਹਰਣ ਵਜੋਂ: http://www.example.com/logo.jog
  • ਸਰੋਤ ਦੀ ਕਿਸਮ - ਇਹ ਸਰੋਤ ਦੀ ਕਿਸਮ ਹੈ ਜੋ ਡਾਉਨਲੋਡ ਕੀਤੀ ਗਈ ਸੀ. ਇੱਥੇ ਚਾਰ ਕਿਸਮਾਂ ਦੇ ਸਰੋਤ ਹਨ.
    • ਵੇਬ ਪੇਜ
    • ਚਿੱਤਰ
    • ਬਾਹਰੀ ਸਰੋਤ - ਲਿੰਕ ਟੈਗ ਤੋਂ ਡਾedਨਲੋਡ ਕੀਤਾ ਕੋਈ ਵੀ ਸਰੋਤ
    • ਸਕ੍ਰਿਪਟ
  • ਨਵੀਂ ਫਾਈਲ ਨਾਮ - ਨਵੀਂ ਫਾਈਲ ਨਾਮ ਜੋ ਸਰੋਤ ਰਿਹਾ ਹੈ saveਦੇ ਅਧੀਨ d. ਯਾਦ ਰੱਖੋ ਕਿ ਇਹ ਕਾਲਮ ਵੀ ਫਾਈਲ ਦਾ ਲਿੰਕ ਰੱਖਦਾ ਹੈ, ਜੋ ਕਿ ਡਾedਨਲੋਡ ਕੀਤੇ ਸਾਰੇ ਸਰੋਤਾਂ ਦੀ ਜਾਂਚ ਕਰਨਾ ਬਹੁਤ ਸੌਖਾ ਬਣਾ ਦਿੰਦਾ ਹੈ.

ਇਹ ਫਾਈਲ ਤੁਹਾਨੂੰ ਉਹਨਾਂ ਨਵੇਂ ਪੁਰਾਣੇ ਟਿਕਾਣਿਆਂ ਤੇ ਨਵੇਂ ਨਾਮਾਂ ਦੇ ਮੈਪ ਬਣਾਉਣ ਵਿੱਚ ਸਹਾਇਤਾ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ. ਇਸਦੀ ਜ਼ਰੂਰਤ ਹੈ ਕਿਉਂਕਿ ਇੱਕ URL ਨੂੰ ਇੱਕ ਫਾਈਲ structureਾਂਚੇ ਵਿੱਚ ਸਿੱਧੇ ਮੈਪ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਕਿਉਂਕਿ ਇੱਕ URL ਸਿੱਧੇ ਫਾਈਲ ਮਾਰਗ ਵਿੱਚ ਸਟੋਰ ਕਰਨ ਲਈ ਬਹੁਤ ਵੱਡਾ ਹੋ ਸਕਦਾ ਹੈ.

ਇਸ ਤੋਂ ਇਲਾਵਾ ਬਹੁਤ ਸਾਰੇ ਨਿਰਮਾਣ ਵੀ ਹੋ ਸਕਦੇ ਹਨ ਖ਼ਾਸਕਰ ਜਦੋਂ ਇਕ ਵੈੱਬ ਪੇਜ ਵੱਖ ਵੱਖ ਪੁੱਛਗਿੱਛ ਨੂੰ ਬਦਲ ਕੇ ਬਹੁਤ ਸਾਰੀਆਂ ਵੱਖਰੀਆਂ ਸਮਗਰੀ ਨੂੰ ਦਰਸਾ ਸਕਦਾ ਹੈ string ਪੈਰਾਮੀਟਰ! ਇਸ ਦੀ ਬਜਾਏ ਅਸੀਂ ਫਾਈਲ ਫੋਲਡਰ ਵਿੱਚ ਇੱਕ ਫਲੈਟ ਬਣਤਰ ਵਿੱਚ ਵੈਬਸਾਈਟ ਨੂੰ ਸਟੋਰ ਕਰਦੇ ਹਾਂ ਅਤੇ ਇਹਨਾਂ ਫਾਈਲਾਂ ਨੂੰ ਅਸਲੀ mapਾਂਚੇ ਵਿੱਚ ਮੈਪ ਕਰਨ ਲਈ ਤੁਹਾਨੂੰ ਡੇਟਾ. Html ਫਾਈਲ ਦਿੰਦੇ ਹਾਂ.

ਬੇਸ਼ਕ ਇਸ ਦੇ ਕਾਰਨ ਤੁਸੀਂ ਇੱਕ ਡਾਉਨਲੋਡ ਕੀਤੇ HTML ਪੇਜ ਨੂੰ ਖੋਲ੍ਹ ਨਹੀਂ ਸਕਦੇ ਅਤੇ ਵੈਬ ਪੇਜ ਨੂੰ ਵੇਖਣ ਦੀ ਉਮੀਦ ਕਰਦੇ ਹੋ ਜੋ ਤੁਸੀਂ ਵੈੱਬ 'ਤੇ ਵੇਖਿਆ ਹੈ. ਅਜਿਹਾ ਕਰਨ ਲਈ ਤੁਹਾਨੂੰ ਚਿੱਤਰ, ਸਕ੍ਰਿਪਟ ਅਤੇ CSS ਸਰੋਤ ਆਦਿ ਦੇ ਮਾਰਗਾਂ ਨੂੰ ਦੁਬਾਰਾ ਲਿਖਣ ਦੀ ਜ਼ਰੂਰਤ ਹੋਏਗੀ ਤਾਂ ਕਿ HTML ਫਾਈਲ ਉਨ੍ਹਾਂ ਨੂੰ ਤੁਹਾਡੇ ਸਥਾਨਕ ਫਾਇਲ structureਾਂਚੇ ਵਿੱਚ ਲੱਭ ਸਕੇ.

ਇਕ ਹੋਰ ਫਾਈਲ ਜਿਹੜੀ ਜ਼ਿਪ ਫਾਈਲ ਦੇ ਰੂਟ ਵਿਚ ਸ਼ਾਮਲ ਕੀਤੀ ਜਾਏਗੀ, ਨੂੰ Website.csv ਕਿਹਾ ਜਾਂਦਾ ਹੈ. ਇਹ ਬਿਲਕੁਲ ਉਹੀ ਜਾਣਕਾਰੀ ਰੱਖਦਾ ਹੈ ਜਿਵੇਂ ਡੇਟਾ. Html ਫਾਈਲ. ਹਾਲਾਂਕਿ ਇਹ ਇਸ ਸਥਿਤੀ ਵਿੱਚ ਸ਼ਾਮਲ ਹੈ ਕਿ ਤੁਸੀਂ ਵੈਬਸਾਈਟ ਡਾ downloadਨਲੋਡ ਨੂੰ ਪੜ੍ਹਨਾ ਅਤੇ ਇਸਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਸ਼ਾਇਦ ਡਾਉਨਲੋਡ ਕੀਤੀ ਵੈੱਬਸਾਈਟ ਨੂੰ ਮੁੜ ਤਿਆਰ ਕਰਨ ਲਈ URL ਤੋਂ ਫਾਈਲਾਂ ਵਿੱਚ ਮੈਪਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਕੇ.