« Archives in Czerwiec, 2011

Parser pkt.pl part2

Niestety z udostepnieniem programu nie jest tak prosto jak mogłoby się wydawać. Na pewnym forum zwrócono mi uwagę abym “dokładnie zapoznał się z regulaminem pkt.pl” i podobnych serwisów. Okazało się że tworzenie baz/parsowanie tekstów ze stron podobnych do pkt.pl jest niezgodne z ich regulaminem, na kuriozum zakrawa tez stwierdzenie jednego z brokerów bazy danych zumi.pl, która napisał do mnie, że nawet ręczne spisanie na kartce takich danych jest złamaniem regulaminu. Oczywiście nie mam zamiaru tutaj w żaden sposób łamać regulaminu serwisów, które takie dane udostępniają. Dlatego też nie mogę udostępnić programu. Niestety …

Parser pkt.pl w C#

Z powodu nagłej potrzeby skompletowania bazy danych firm zacząłem szukać programu/ skryptu, który by parsował jakąś porządną stronę, na której takie informacje są. Szukałem jak to mówi jedno z praw Murphego “długo i bezskutecznie”. Okazało się, że wszystkie takie wynalazki są płatne można kupić na allegro za powiedzmy 150 PLN. Z racji tego, że średnio mi się uśmiecha płacić jakąkolwiek kasę za takie rzeczy postanowiłem sam sobie coś spłodzić, co odwaliłoby za mnie robotę. W PHP pisać specjalnie nie lubię więc już na starcie sobie odpuściłem, pomyślałem, że w sumie Python do tego świetnie się nadaje. Jednak po dłuższej chwili namysłu (przypomniałem sobie jak walczyłem z Pythonem i Paramiko na Windowsie) doszedłem do wniosku, że owszem można w Pythonie ale pod Linuxem bo pod Windowsem to niestety ale szkoda nerwów, a że akurat z Windowsa muszę korzystać bo gramy z żoną w Wiedźmina 2 Uśmiech to pomysł przełączania się między systemami odpadł również. I tak oto powstał on jedyny unikalny, wyjątkowy Szeroki uśmiech parser w C#. Wrzucę screeny, a za tydzień udostępnię program na blogu, tylko muszę zrealizować mój szatański plan. Tymczasem idę gotować zupę szczawiową jakby kogokolwiek to interesowało Uśmiech

pkt1pkt2