ਵੈੱਬ ਨੂੰ ਕੈਪਚਰ ਅਤੇ ਕਨਵਰਟ ਕਰਨ ਲਈ ਟੂਲ

ਚਿੱਤਰਾਂ ਤੋਂ ਟੈਕਸਟ ਕੱ Extੋ

ਅਕਸਰ ਮਹੱਤਵਪੂਰਣ ਪਾਠ ਦੀ ਜਾਣਕਾਰੀ ਨੂੰ ਚਿੱਤਰਾਂ ਵਿੱਚ ਸੰਭਾਲਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਪਰ ਗਰੈਬਜ਼ਿਟ ਦਾ ਵੈਬ ਸਕ੍ਰੈਪਰ ਆਪਟੀਕਲ ਅੱਖਰ ਪਛਾਣ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਸ ਜਾਣਕਾਰੀ ਨੂੰ ਆਪਣੇ ਆਪ ਕੱractਣ ਦੀ ਯੋਗਤਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ. ਹਾਲਾਂਕਿ ਜਿਵੇਂ ਇਹ ਕਲਾਤਮਕ ਦਾ ਇੱਕ ਰੂਪ ਹੈ intਨਤੀਜਾ ਹਮੇਸ਼ਾਂ ਸੰਪੂਰਨ ਨਹੀਂ ਹੁੰਦਾ.

ਚਿੱਤਰਾਂ ਤੋਂ ਟੈਕਸਟ ਕੱractਣ ਲਈ ਤੁਹਾਨੂੰ ਇਸ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ Utility.Image.extractText ਹੇਠ ਦਿਖਾਇਆ ਗਿਆ ਦੇ ਤੌਰ ਤੇ ਵਿਧੀ.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

ਇਹ ਉਦਾਹਰਣ ਦੋਵੇਂ ਵੈਬ ਪੇਜ ਤੋਂ ਸਾਰੇ ਚਿੱਤਰ ਯੂਆਰਐਲ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ ਅਤੇ ਫਿਰ ਯੂਆਰਐਲ ਨੂੰ ਐਕਸਟਰੈਕਟ ਟੈਕਸਟ ਵਿਧੀ ਵਿਚ ਭੇਜਦੇ ਹਨ ਜੋ ਹਰੇਕ ਚਿੱਤਰ ਤੋਂ ਟੈਕਸਟ ਦਾ ਡਾਟਾ ਕੱ toਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ ਅਤੇ ਕਿਸੇ ਵੀ ਮੈਚਾਂ ਨੂੰ ਐਰੇ ਵਜੋਂ ਵਾਪਸ ਭੇਜਦਾ ਹੈ strings.

ਜੇ ਚਿੱਤਰ ਵਿਚਲਾ ਪਾਠ ਵੱਖਰੀ ਭਾਸ਼ਾ ਵਿਚ ਹੈ ਤਾਂ ਤੁਹਾਨੂੰ ਹੇਠਾਂ ਦਿੱਤੇ ਅਨੁਸਾਰ ਦੋ ਅੱਖਰਾਂ (ISO 639-1) ਫਾਰਮੈਟ ਦੀ ਵਰਤੋਂ ਕਰਦਿਆਂ ਸਹੀ ਭਾਸ਼ਾ ਕੋਡ ਨਿਰਧਾਰਤ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');