Treoir Semalt ar Síneadh Scraper Do Chrome

Le go mairfeadh aon ghnó agus go bhfásfaidh sé sa deireadh, is gá fanacht chun tosaigh ar a chuid iomaitheoirí agus rioscaí éagsúla. Bealach cinnte chun dearmad a dhéanamh faoi na fadhbanna seo is ea cinntí a dhéanamh bunaithe ar shonraí anailíseacha. Is féidir sonraí den sórt sin a fháil trí scriosadh sonraí. Sin an áit a dtagann síneadh éasca scraper do Chrome isteach: ní amháin go n-éascóidh sé an próiseas bainte sonraí ach go mbeidh sé indéanta scrabhadh ar siúl gan socruithe casta.

Conas Scraper a úsáid

    1. Is é an chéad rud a chaithfidh tú a dhéanamh ná an síneadh a shuiteáil, mar sin téigh go dtí an siopa gréasáin chrome, déan cuardach ar "scraper" agus cliceáil ar add to Chrome.

    2. Téigh go dtí an suíomh Gréasáin a bhfuil sé ar intinn agat sonraí a scrabhadh uaidh, marcáil an iontráil a bhfuil suim agat ann trí aird a tharraingt air. Cliceáil ar dheis air agus roghnaigh "scrape similar" ar an roghchlár a thagann aníos.

    3. Trí é sin a dhéanamh seolfar fuinneog consól scraper ar leithligh. Anseo, feicfidh tú liosta de na sonraí scríobtha .

    4. Chun an t-ábhar a shábháil, cliceáil ar “save to Google docs,” easpórtálfaidh sé seo na sonraí go huathoibríoch chuig scarbhileog Google.

Scrapáil leathnaithe

Sa chás go bhfuil tú ag pleanáil níos mó sonraí a scrabhadh, is féidir leat an cur chuige chun cinn a úsáid. Tabhair faoi deara, beidh sé i bhfad níos éasca oibriú leis an uirlis má tá roinnt eolais agat ar HTML. Cuir i gcás gur theastaigh uait sonraí a scrabhadh ó fhoinse a bhfuil cartlann aici bunaithe ar shonraí sraitheanna ama. Sa chás sin, má dhéanann tú iarracht ar an modh a thuairiscítear thuas, gheofá na sonraí garbled.

Chun an cheist seo a réiteach, is féidir leat úsáid a bhaint as teanga fiosrúcháin HTML agus XML ar a dtugtar XPath. Cad a dhéanann sé? Aithníonn XPath sonraí maidir leis na heilimintí éagsúla atá i ngach roghnú. Seo a leanas treoir ar conas é a dhéanamh:

1. Téigh go dtí an consól Scraper, ar thaobh na láimhe clé uachtair ba chóir duit cnaipe "XPath" a thabhairt faoi deara, cliceáil air agus dul ar aghaidh chun an tábla tosaigh a chur le chéile.

2. Ní mór duit an XPath a scríobh don ghné cheart. Taispeánfar an XPath reatha a chuimsíonn an fhaisnéis iomlán i bhformáid mar seo "// div [3] / div [3] / div [2] / div". Aithneoidh an ríomhaire na heilimintí <div> sa doiciméad HTML.

3. Chun na sonraí aitheanta a scaradh, caithfidh tú na colúin Scraper a úsáid. Chun é sin a dhéanamh, ní mór duit na cineálacha éagsúla faisnéise atá ar fáil agat a lorg. B’fhéidir go mbeidh teidil agat ag brath ar na sonraí atá á scríobadh agat. Tá na teidil seo i láthair in aice le gach tacar sonraí. Tá clib ag gabháil leo, sa chás seo, clib <b>.

4. Ag baint úsáide as eilimint iniúchta aimsigh agus cuir an chlib <b> le do XPath. Anois is féidir leat an chéad cholún seo a lipéadú mar an "colún teidil" mar liostálfaidh sé síos na teidil. Lean ar aghaidh chun XPaths éagsúla a chruthú do gach colún atá uait.

5. Cliceáil ar an scrape agus bainfidh an síneadh na sonraí go huathoibríoch agus eagróidh siad iad sna colúin éagsúla atá leagtha síos agat.