Softver za zbiranje podatkov z več spletnih strani

Leska

Pripravnik
8. sep 2007
268
0
16
Na neki spletni strani je seznam nekaj 100 inštitucij. Če klikneš na link te inštitucije, se ti odpre nova stran s seznamom zaposlenih na tej inštituciji (navedeni so v tabeli, okrog tabele je "solata" - meniji, slike, ...).
Sestavil bi rad enoten seznam (npr. v Excelu), na katerem bi imel podatke o vseh zaposlenih (vključno s tem, s katere inšitucije prihajajo).
Ker je - kot rečeno - inštitucij več 100, tega ne bi rad počel na roke - obstaja kakšen program, ki bi to znal narediti?
 

Fly

Guru
21. jul 2007
2.667
515
113
težka bo. Če bi imela vsaka inštitucija povsem enako zgradbo strani, enako zgrajen seznam zaposlenih, potem bi se dalo napisati tak programček.
 

Leska

Pripravnik
8. sep 2007
268
0
16
Zgradba vseh strani je enaka - vsebuje eno tabelo, ki ima enako strukturo (imena stolpcev).
Odkril sem, da verjetno softver spada v skupino Web_scraping.
Anyone?
 

Fly

Guru
21. jul 2007
2.667
515
113
Že narejen program, ki ti bo naredil to kar ti hočeš dvomim da obstaja.
 

philips

Guru
Osebje foruma
Administrator
17. avg 2007
9.878
698
113
Če ni skrivnost, lahko sem prilepiš link in se bo mogoče kdo sam opogumil in kaj takšnega napisal.
 

Leska

Pripravnik
8. sep 2007
268
0
16
Evo, na
http://leska.com/q.htm
je kratek "master" seznam s samo nekaj polji (dejanski seznam vsebuje več 100 vrstic in cca. 20 polj).
Link do zaposlenih je v 1. stolpcu.
Izhodna datoteka naj za vsakega zaposlenega izpiše ime, del. mesto in polja iz master datoteke.

PS: Poskusil sem z
http://www.datatoolbar.com/
pa ga nekako ne znam prepričati, da pobere prava polja oz. ne zmelje do konca ...
 

jgfd

Pripravnik
7. sep 2007
348
0
16
jaz bi probal s samim Excelom

Ima možnost da pridobi podatke z interneta
za avtomatizacijo uporabiš makroje
 

Leska

Pripravnik
8. sep 2007
268
0
16
Ja, to vem tudi sam in se bom pač lotil, če ne bom našel specialnega softvera.