ਇੱਕ ਆਮ ਕੰਮ ਇੱਕ ਵੈਬਸਾਈਟ ਤੋਂ ਲਿੰਕ ਕੱractਣਾ ਹੈ, ਖ਼ਾਸਕਰ HTML ਲਿੰਕ. ਖੁਸ਼ਕਿਸਮਤੀ ਨਾਲ ਜਦੋਂ ਇਹ ਵਰਤਣਾ ਆਸਾਨ ਹੁੰਦਾ ਹੈ ਗਰੈਬਜ਼ਿਟ ਦਾ ਵੈਬ ਸਕ੍ਰੈਪਰ. ਸਭ ਤੋਂ ਪਹਿਲਾਂ ਸਧਾਰਣ ਵੇਰਵਿਆਂ ਦੇ ਨਾਲ ਇੱਕ ਨਵੀਂ ਸਕ੍ਰੈਪ ਬਣਾਓ ਜਿਵੇਂ ਕਿ ਸਕ੍ਰੈਪ ਦਾ ਸ਼ੁਰੂਆਤੀ ਪੰਨਾ ਅਤੇ ਕੋਈ ਹੋਰ ਵਿਕਲਪ.
ਫਿਰ 'ਤੇ ਜਾਓ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਟੈਬ ਤੇ ਕਲਿੱਕ ਕਰੋ ਅਤੇ ਬਟਨ ਇਹ ਦਾਖਲ ਹੋ ਜਾਵੇਗਾ
Page
ਕੀਵਰਡ into ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ ਅਤੇ ਇੱਕ ਬੂੰਦ ਨੂੰ ਖੋਲ੍ਹਣਗੇ. ਚੁਣੋ getTagAttributes
ਸੂਚੀ ਵਿੱਚੋਂ ਅਗਲਾ ਐਡ 'href'
ਪਹਿਲੇ ਪੈਰਾਮੀਟਰ ਦੇ ਰੂਪ ਵਿੱਚ, ਇਹ ਵੈਬ ਸਕ੍ਰੈਪਰ ਨੂੰ href ਗੁਣ ਨੂੰ ਕੱractਣ ਲਈ ਕਹਿੰਦਾ ਹੈ, ਫਿਰ ਇੱਕ ਕੌਮਾ ਟਾਈਪ ਕਰੋ.
ਅੱਗੇ ਕਲਿੱਕ ਕਰੋ ਇਹ ਤੁਹਾਨੂੰ ਵੈੱਬ ਸਕ੍ਰੈਪਰ ਨੂੰ ਦੱਸਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਕਿ href ਗੁਣ ਨੂੰ ਕਿਹੜੇ ਤੱਤਾਂ ਵਿੱਚੋਂ ਕੱ .ਣਾ ਹੈ. ਫਿਲਟਰ ਵਿੰਡੋ ਵਿੱਚ ਇਹ ਪੱਕਾ ਕਰੋ ਕਿ ਕਿਸਮ 'ਵੈਬ ਪੇਜ' ਤੇ ਨਿਰਧਾਰਤ ਕੀਤੀ ਗਈ ਹੈ ਅਤੇ ਪਾਬੰਦੀ 'ਟੈਗ ਨਾਮ' ਅਤੇ 'ਬਰਾਬਰ' ਹੈ. ਫਿਰ ਦਾਖਲ ਹੋਵੋ
a
ਟੈਕਸਟ ਬਕਸੇ ਵਿਚ ਅਤੇ ਫਿਰ ਸ਼ਾਮਲ ਬਟਨ ਤੇ ਕਲਿਕ ਕਰੋ ਅਤੇ ਫਿਰ ਫਿਲਟਰ ਬਟਨ ਸੰਮਿਲਿਤ ਕਰੋ. ਲਾਈਨ ਦੇ ਅੰਤ ਵਿੱਚ ਅਰਧ-ਕੌਲਨ ਜੋੜ ਕੇ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਖਤਮ ਕਰੋ.
ਤੁਹਾਨੂੰ ਕੁਝ ਅਜਿਹਾ ਛੱਡ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ ਜਿਵੇਂ ਕਿ ਹੇਠਾਂ ਦਰਸਾਇਆ ਗਿਆ ਹੈ.
Page.getTagAttributes('href', {"tag":{"equals":"a"}});
ਉਪਰੋਕਤ ਕੋਡ ਵੈਬ ਪੇਜ ਤੋਂ ਸਾਰੇ ਲਿੰਕ ਯੂਆਰਐਲ ਨੂੰ ਕੱ will ਦੇਵੇਗਾ, ਪਰ ਹੁਣ ਸਾਨੂੰ ਇਸ ਦੀ ਜ਼ਰੂਰਤ ਹੈ save ਉਹ ਲਿੰਕ ਯੂਆਰਐਲ ਦੇ. ਅਜਿਹਾ ਕਰਨ ਲਈ, ਅਸੀਂ ਇਸ ਕਮਾਂਡ ਨੂੰ ਘਟਾਓਗੇ ਅਰਜਨ-ਕੋਲਨ ਨੂੰ ਏ Data.save
ਕਮਾਂਡ. ਅਜਿਹਾ ਕਰਨ ਲਈ, ਲਾਈਨ ਦੀ ਸ਼ੁਰੂਆਤ ਤੇ ਜਾਓ ਅਤੇ ਚੁਣੋ ਬਟਨ ਫਿਰ ਡਰਾਪ ਡਾਉਨ ਦੀ ਚੋਣ ਕਰੋ
save
, ਫਿਰ ਲਾਈਨ ਦੇ ਅੰਤ ਤੇ ਜਾਓ ਅਤੇ ਇੱਕ ਕਾਮੇ ਸ਼ਾਮਲ ਕਰੋ. ਫਿਰ ਜੋ ਤੁਸੀਂ ਡੈਟਾਸੇਟ ਨੂੰ ਕਾਲ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਨੂੰ ਸ਼ਾਮਲ ਕਰੋ ਜਿਵੇਂ ਕਿ 'ਮੇਰੀ ਵੈਬਸਾਈਟ', ਫਿਰ ਇਕ ਹੋਰ ਕੌਮਾ ਸ਼ਾਮਲ ਕਰੋ ਅਤੇ ਫਿਰ ਇਕ ਹੋਰ ਪੈਰਾਮੀਟਰ ਸ਼ਾਮਲ ਕਰੋ ਜਿਵੇਂ ਕਿ 'ਲਿੰਕਸ' ਨੂੰ ਦਰਸਾਓ ਅਤੇ ਫਿਰ ਕਮਾਂਡ ਨੂੰ ਇਕ ਨਾਲ ਬੰਦ ਕਰੋ. )
ਅਰਧ-ਕੋਲਨ ਤੋਂ ਪਹਿਲਾਂ.
ਤੁਹਾਡੇ ਕੋਲ ਹੁਣ ਹੇਠਾਂ ਦਿੱਤੀਆਂ ਖੁਰਚੀਆਂ ਹਿਦਾਇਤਾਂ ਹੋਣੀਆਂ ਚਾਹੀਦੀਆਂ ਹਨ.
Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');
ਹੁਣ ਜੇ ਤੁਸੀਂ ਸਕ੍ਰੈਪ ਚਲਾਉਂਦੇ ਹੋ ਤਾਂ ਤੁਸੀਂ ਵੈਬਸਾਈਟ ਤੋਂ ਸਾਰੇ ਲਿੰਕ ਕੱ .ੋਗੇ. ਇਹ ਮੇਰੀ ਵੈਬਸਾਈਟਸ ਦੇ ਨਾਮ ਦੇ ਨਾਲ, ਲਿੰਕਾਂ ਦੇ ਕਾਲਮ ਨਾਮ ਦੇ ਨਾਲ ਇੱਕ ਟੇਬਲ ਬਣਾਏਗਾ ਜੋ ਫਿਰ ਨਿਰਯਾਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ into ਬਹੁਤ ਸਾਰੇ ਵੱਖ ਵੱਖ ਫਾਰਮੈਟ ਜਿਵੇਂ ਕਿ ਐਕਸਐਮਐਲ, ਸੀਐਸਵੀ ਜਾਂ ਇੱਕ ਸਪ੍ਰੈਡਸ਼ੀਟ. ਇਸ ਟਿutorialਟੋਰਿਅਲ ਨੂੰ ਸਕ੍ਰੈਪ ਨਿਰਦੇਸ਼ਾਂ ਟੂਲਬਾਰ ਵਿਚ ਵਿਜ਼ਾਰਡ ਬਟਨ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵੀ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਸੀ.