Wpisy z tagiem: blog
środa, 22 lutego 2012
Od dłuższego czasu serwis blogowy Blox boryka się z plagą spamu. Słyszałem zapewnienia, że moderatorzy/admini walczą z tym zjawiskiem, ale wydaje mi się, że bez większych sukcesów, a nawet, że problem spamu się nasila. Jest to zjawisko dla wszystkich (poza spamerami) niekorzystne, a nierzadko na stronie głównej o pewnych porach spamy stanowią 30 i więcej procent wpisów. Postanowiłem zerknąć na proces zakładania konta od początku. Pierwsze co rzuciło mi się w oczy, to prostota CAPTCHA. Być może parę lat temu wystarczało coś takiego, by odstraszyć spamerów, ale wojna trwa - istnieją narzędzia do automatycznego rozpoznawania nawet dość skomplikowanych CAPTCHA ze stosunkowo dużą pewnością (grubo ponad 50%). Niedawno nawet Jogger, który pozwalał właścicielowi bloga na mocne zmiany wyglądu CAPTCHA (kształt, wielkość, kolor), przy komentarzach dorzucił do niej litery obok cyfr, bo spamerzy się przebijali... Żeby sprawdzić, czy nie przypadek, że CAPTCHA jest taka słaba, wcisnąłem F5, raz, drugi, trzeci... I okazało się, że trafiłem na powtarzające się słowa. Chwilę się pobawiłem i faktycznie, nie da się ukryć, CAPTCHA powtarza się i to - na oko - często. Postanowiłem sprawę zbadać dokładniej. Sposób badania: uruchomienie przeglądarki, wyczyszczenie historii, w każdej serii 50 przeładowań strony (F5 lub ctrl-r), zapisanie wyników do pliku (każdy wynik w pojedynczej linii) w takiej kolejności, w jakiej się pojawiały. Żeby wykluczyć wpływ User Agent i czasu, każda seria wykonywana na różnej przeglądarce i w odstępie minimum kilkudziesięciu minut. W pierwszej serii (przeglądarka chromium) 50 ciągów wyrazów wystąpiły 32 unikatowe ciągi, przy czym 4 wystąpiły trzykrotnie, 10 dwukrotnie, a 18 tylko raz. Dodatkowo rzuciła mi się w oczy prawdopodobna metoda powstawania wielu CAPTCHA - podział słowa na sylaby, połączone z ew. wyrzuceniem niektórych liter, a następnie wymieszanie tych slab. Przykładowo zykamu i kazymu (czyli muzyka), letefon, fontele i fonlete (czyli telefon), zetaga i gataze (czyli gazeta), lafiorka, fiorkala, fiorlaka (czyli kalafior). Druga seria, kilkadziesiąt minut później na midori - 34 unikatowe ciągi, jeden wystąpił czterokrotnie, 13 dwukrotnie, 20 jednokrotnie. Wyrazy zdecydowanie powtarzają się między seriami - dla obu serii łącznie wystąpiło 46 unikatowych ciągów, 2 wystąpiły pięciokrotnie, 6 - czterokrotnie, 8 - trzykrotnie, 12 -dwukrotnie, 18 - jednokrotnie. Ponieważ ciąg znaków pod którym można poprać losowany obrazek może być stały (z danego można korzystać wiele razy), postanowiłem uprościć sobie pobieranie i przeliczanie. Szybki skrypt, który przy pomocy wget pobiera zadaną ilość obrazków i zapisuje do kolejnych plików, a następnie sprawdzenie sum kontrolnych (md5) tychże plików. I tu ciekawostka - sumy kontrolne praktycznie się nie powtarzają. Sprawdziłem organoleptycznie i faktycznie - o ile wyrazy powtarzają się często, to praktycznie każdy plik jest binarnie inny. Czyli raczej mała ilość wyrazów raczej nie wynika z chęci cache'owania. Dla porządku: dla 100 plików 3 miały takie same sumy kontrolne, a kolejne 5 sum występowało dwa razy. Powtórzyłem eksperyment dla 1000 plików. Pojawiło się 611 unikatowych sum kontrolnych, jedna z sum występowała 7 razy, jedna 6, sześć wystąpiło 5 razy, cztery - 20 razy, trzy - 53 razy, dwie - 188 razy i jedna - 342 razy. Nie sprawdzałem dokładnie, czy dany wyraz w CAPTCHA koreluje z ciągiem w treści (na oko nie), ani z jaką skutecznością zadziała automatyczne rozpoznawanie, ale przy tak częstym powtarzaniu się ciągów znaków i plików nie ma to znaczenia - wygląda, że baza jest za mała, a przekształcenie zbyt proste i można spokojnie stworzyć skrypt, który porówna sumę md5 wygenerowanego pliku z arbitralną bazą. O problemie pisałem wstępnie na forum, póki co bez odzewu. W każdym razie liczę na to, że wpis zmotywuje administratorów blox do załatania ewidentnej dziury w zakładaniu nowych kont. Obecne likwidowanie spamerskich blogów przypomina wylewanie wody z łódki, zamiast załatania w niej dziury, przez którą wody nabiera. Oczywiście najlepsze byłoby podpięcie jakiegoś znanej, sprawdzonej implementacji CAPTCHA, zamiast wymyślania koła od nowa (i to sugestia dla tych, którzy chcą stosować tego typu rozwiązanie) ale wydaje się, że nawet z istniejącą implementacją można prosto zadziałać w taki sposób, że stanie się ona choć w części efektywna. Przede wszystkim mam na myśli zwiększenie bazy słów i ilości przekształceń. Obok złych wiadomości są też i dobre - co prawda problem nie jest to Blox, tylko ogólnie dotyczy konto.gazeta.pl, ale - jak wynika z korespondencji z administratorami Blox - jest znany i ma być najdalej w kwietniu poprawiony. Pozostaje uzbroić się w odrobinę cierpliwości i liczyć na to, że po załataniu dziury uda się skutecznie pozbyć spamerów. W tej chwili bywa tak, że 100% wpisów na głównej stanowią spamy...
niedziela, 22 stycznia 2012
Dawno nie było nic o statystykach na blogu - ostatni wpis w tym temacie prawie półtora roku temu. No to tak dla pamięci - systemy operacyjne. Windows XP - 36,5%, Windows 7 - 22,3%, Vista - 9,2%, czyli łącznie Windows łącznie 68%. Skutek większej ilości wejść z wyszukiwarki na niezwiązane z Linuksem frazy, zapewne. Linux prawie 26%, Mac OS X - spadek do 2,2%. Jeśli chodzi o przeglądarki to Firefox nadal trzyma się mocno - 51%. Nie jest niespodzianką przyrost użytkowników Chrome - 19%, lekki spadek Opery - 11,5%. Różne wersje IE - minimalne umocnieni, do 10,5%. Safari 2,5%, Mozilla/5.0 (Netscape) - drastyczny spadek do 4%. Rozdzielczość ekranu bez większych zmian - liderem pozostaje kategoria 1280x800 lub 1280x1024 z 32,5% (nadal spadek). Tradycyjnie Google zamieszało z pagerankiem. Tym razem pozytywnie, bo jest 5 dla tego bloga, natomiast zdziwił mnie wysoki pagerank moich pozostałych nowych tworów - zarówno mój blog muzyczny jak i blog będący fanpage Bez Krótkich Spodni mają aż 4. Czyli więcej od mojego starego bloga. Chyba aberracja. Zmieniło się trochę, jeśli chodzi o zabawę z reklamami. Pożegnałem AdTaily, próbowałem znaleźć polską alternatywę. Bez efektów. Koniec końców postanowiłem wrócić do ogólnoświatowego monopolisty w tym względzie, czyli Google. W sumie za wcześnie mówić o efektach, jedno co warto powiedzieć to fakt, że Google, mimo kreowania się na proste, wcale proste nie jest. Za dużo opcji, za dużo terminów. Cóż, taki standard, ale przydałby się widok uproszczony, przynajmniej na początku. ;-)
sobota, 26 listopada 2011
Ostatni wpis traktujący o tym jak sprawdzić IP komputera zaowocował sporą ilością zapytań o to, jak sprawdzić IP komentującego na blogu albo forum. Sprawa może być utrudniona, bo adres IP bywa uznawany za daną osobową, a poza tym dobra praktyką jest ukrywanie przynajmniej części adresu przed osobami postronnymi. Zasadniczo wyróżnić można dwa przypadki: Sprawdzanie IP komentarza przez osoby postronneWariant gorszy, bo dostęp jest bardzo ograniczony. W tym wariancie mamy trzy przypadki:
Sprawdzanie IP komentarza przez właściciela serwisuWariant lepszy, bo obok wszystkich środków dostępnych w poprzednim przypadku, możemy:
Możemy też oczywiście sprawdzić IP połączenia, z którego zamieszczono komentarz w logach serwera WWW, jeśli działa na naszym hostingu lub mamy dostęp do logów. HTH i wyczerpuje temat ustalania adresu IP.
piątek, 23 września 2011
Cały czas ograniczałem się w sprawie dodawania klipów i muzyki na tym blogu. Z jednej strony jest to ważne, z drugiej często dość ulotne, a wpisy na Blipie czy Facebooku nie są dobrym miejscem do zachowywania i łatwego wyszukiwania czegoś, wiec w ramach porządków postanowiłem wynieść wszystko, co związane z muzyką i klipami na osobnego bloga Rozie's music. Znaczy się kategoria Rozrywka zostaje, natomiast raczej nie ma się co spodziewać w niej niczego o muzyce. Podobnie znikną wstawki z muzyką z Youtube - zbyt dominowały treść tego bloga. Nie ukrywam też, że Blox jest dość ciężki/trudny/toporny. Przypomniałem sobie o tym uruchamiając ostatnio bloga o punkowej kapeli Bez Krótkich Spodni. Po prostu szukam czegoś, co pozwoli na szybkie i proste wrzucanie treści - padło na Tumblr, którym już kiedyś chciałem się pobawić. Last but not least, chciałem spróbować blogowania po angielsku. Zatem zapraszam.
środa, 21 września 2011
Na informację o serwisie doLoop natknąłem się podczas lektury bloga o najlepszych dodatkach do blogów. W skrócie jest to wymiana ruchu - ja linkuję kogoś, ktoś linkuje mnie. Z grubsza tematycznie, tzn. można wybrać, jaką tematykę chcemy linkować i określamy kategorię tematyczną własnych wpisów. Postanowiłem wypróbować, jak to działa i co to daje. Zaczęło się niezbyt dobrze. Po pierwsze, na stronie serwisu doLoop nie ma regulaminu (AKA ToS). Jest FAQ, które coś tam wyjaśnia, ale normalnego regulaminu nie ma. Niefajnie, bo nie musi być nie wiadomo co, ale wystarczyłoby w kilku punktach opisać warunki korzystania z serwisu. Po drugie, zamieszczanie linka w serwisie jest całkowicie ręczne. Po prostu trzeba wklepać linka, opis, tagi. Wszystko ręcznie, bez możliwości skorzystania z automatów typu javascript i zamieszczenia danych typu tytuł czy tagi automatycznie (OK, tytuł może zaciągnąć automagicznie z URLa). Co przecież jest jak najbardziej wykonalne - Folksr to potrafi. Marnym pocieszeniem - przynajmniej dla mnie - jest możliwość dodania kanału RSS i wybierania postów do dodania z niego. Na dodatek wymagane jest dodanie zdjęcia. Po prostu i zwyczajnie nie da się zamieścić wpisu bez zdjęcia. Na dodatek zdjęcie musi pasować do treści. W praktyce pewnie czeka mnie szukanie jakichś zdjęć na licencji Creative Commons, albo - raczej - public domain, bo CC wymaga podania autora o co trudno w tej sytuacji. Za robieniem własnych fotek/zrzutów nie przepadam. Nawet do wpisów, co dopiero do zajawek o wpisach. Po trzecie, mail z potwierdzeniem odbioru prośby rejestracji, który przyszedł, miał skopane pl-znaki w temacie, co wygląda delikatnie mówiąc mało profesjonalnie. Mail z potwierdzeniem dodania do serwisu, który dotarł po około 12 godzinach - to samo. No ale skoro dobrnęliśmy do tego momentu, to kontynuujmy... Pozytywem jest bardzo dużo opcji wyglądu widgetu. Powiedziałbym nawet, że za dużo i chyba wolałbym podział na widok podstawowy i zaawansowany. Ale domyślne ustawienia praktycznie nie wymagały korekty (no dobrze, rozmiar zdjęć zmieniłem, ale to podstawa). Testowe zamieszczenie pierwszego wpisu - wypełnianie ręczne dla pojedynczego jest niby do przeżycia, ale na dłuższą metę będzie męczące jak dla mnie - m. in. dlatego nie korzystam z Wykopu czy nie dodaję wpisów do katalogu Flattr. Bardzo fajną rzeczą jest możliwość podania linka do zdjęcia, a następnie prostego wykadrowania i - w razie potrzeby - pomniejszenia w przeglądarce. Przynajmniej nie trzeba uruchamiać edytora grafiki. Za to czas moderacji wpisu to jakiś koszmar - rozumiem, że jest robione ręcznie i uprzedzają w FAQ moderacja postów trwa przeważnie do 12 godzin, ale kilkadziesiąt godzin to trochę przesada. Przynajmniej na początku drażni, kiedy się czeka na efekty, potem nie przeszkadza w ogóle - przestałem zwracać uwagę na czas moderacji. Inne niefajne rzeczy:
Nie miałem przypadku, by dodawany wpis został odrzucony, za to męczące jest ograniczenie w dodawaniu wpisów - w praktyce mogłem dodawać po jednym wpisie dziennie - przypuszczam, że chodzi o swoiste zabezpieczenie antyspamowe. Rozrzut CTR (stosunek wyświetleń reklamy danego posta do wejść) mam spory, bo od ok. 1,3% (beznadziejne zdjęcie) do ok 20% (świeży wpis, CTR spada z czasem). Wyniki, czyli część najważniejsza, bo widget dodaje się w celu zwiększenia ruchu na stronie (albo przyciągnięcia nowych czytelników, jak w moim przypadku). W FAQ piszą przeważnie można liczyć na od 150% do 200% zwiększenia ruchu na twojej stronie po zainstalowaniu widgetu doLoop. Na mój gust o zero za dużo, przynajmniej na tym blogu. 20% jest za to jak najbardziej osiągalne. Wiele zależy od dodanych wpisów - liczy się i opis (tu nie szalałem, po prostu tytuł z bloga), i zdjęcie. W testowym okresie, wynoszącym 14 dni, unikalne wejścia z doLoop stanowiły ok. 15% wszystkich UU. Ogólne zadowolenie - 4/10, na razie zostawiam to, co jest, zobaczę jak będzie wyglądało w dłuższym okresie (będzie aktualizacja statystyk). I rozglądam się za alternatywami. UPDATE: No i jednak doLoop okazał się happeningiem, jak wskazywały na to niektóre rzeczy typu brak ToS czy orty. Od paru dni(!!!) strona główna pokazuje Błąd bazy danych!! Znaczy się do piachu.
środa, 31 sierpnia 2011
Nadal nie wiem, czy powinno się pisać Blog Day czy BlogDay, bo jedni piszą tak, inni inaczej, a strona główna BlogDay też nie może się zdecydować (title), ale w sumie nie to jest istotne. Tegoroczne pięć polecanych blogów: Wampiryczny blog - bezpieczeństwo w cyfrowym świecie - blog o bezpieczeństwie IT, od innych tego typu pozycji odróżnia go to, że jest i aktualizowany dość często, i autorski. Czyli jest co poczytać i nie są to przedruki z innych miejsc czy newsy sprzed paru dni. Ciekawy, nawet jeśli ktoś nie zajmuje się zawodowo bezpieczeństwem. Netia blog - oficjalny blog firmy Netia. Nie jestem z Netią w żaden sposób związany, ale blog mi się podoba i wydaje mi się, że może być ciekawy dla każdego, kto dostarcza Internet klientom indywidualnym (i dla samych klientów też). Oczywiście wszystko jest w PRowym sosie, ale IMO ładny przykład jak można zrobić ciekawy blog firmowy. Bronikowski.com - nie wiem nic specjalnego o autorze i nie podejmuję się pisać o blogu, ale ostatnio stwierdziłem, że dobrze mi się czyta tego bloga. Zdecydowanie IT i geekowo. Clients from hell - A collection of anonymously contributed client horror stories from designers. To zdanie w sumie wyjaśnia wszystko. Zawsze jest coś wesołego do przeczytania i ładnie pokazuje jakie niepojęcie o otaczającym świecie, zwłaszcza wycinku IT, mogą mieć inni ludzie. ZUCH próbuje rysować - pewnie wszyscy znają, ale jakby ktoś nie znał, to zdecydowanie pora nadrobić. Upraszczając - blog z polskim korpo komiksem. Plus sporo ciekawych odsyłaczy i konkursy. Tyle w tym roku. Starałem się robić nie IT i jak widać słabo mi to wyszło. Bardziej best of 2011. Gdyby kogoś interesowało, to tu jest mój BlogDay 2010.
czwartek, 14 lipca 2011
Zauważyłem, że ostatnio sporo ludzi z Blox interesuje się wspomagaczem linkowania LinkWithin (znanego również jako You might also like). Rozwiązanie, choć proste i popularne, niekoniecznie jest najlepsze. Postanowiłem szybko porównać LinkWithin i Folksr, którego integrację z Blox opisywałem kiedyś (patrz też wpis o Folksr na wiki Blox). Oba rozwiązania są darmowe, działają z różnymi systemami blogowymi i mają na celu proponowanie ludziom podobnych - czyli potencjalnie również interesujących - wpisów. Parę cech różniących oba rozwiązania: LinkWithin:
Folksr:
OcenaPierwsze dwa punkty to moim zdaniem remis - jednemu może bardziej odpowiadać automatyka, drugi będzie wolał większą przewidywalność. Po prostu rzecz gustu. Niestety, na Blox trochę psują efekt kiepsko zaimplementowane tagi. Punkt trzeci to zdecydowana przewaga Folksr - w prosty sposób pozwoli na wymianę ruchu między kilkoma swoimi serwisami, albo serwisami o podobnej tematyce, jeśli tylko korzystają z Folksr. Punkt czwarty - punkt dla Folksr. Nieduży, bo nie każdemu zależy na kontroli, ale jednak. Punkt piąty - LinkWithin kliknąłem w minutę. Z Folksr było więcej zabawy, choć tak naprawdę nie jest to trudne, jest opisane i robi się to raz... Punkt dla LinkWithin. Punkt szósty - kolejny punkt dla Folksr, choć znowu raczej nie dla każdego znajomość algorytmu będzie istotna. Kolejne dwa punkty to zdecydowana przewaga Folksr. Statystyki są fajne, od razu widać, do których wpisów wchodzą ludzie, i z jakich wychodzą przy pomocy linków. Z serwisu zawsze prościej i wygodniej korzystać po polsku. Szkoda jedynie, że nie można wprost wybrać języka, wybór jest dokonywany automatycznie na podstawie ustawień w przeglądarce. UPDATE: jak trafnie zauważono w komentarzu, można samemu wybrać język. Ostatni punkt to przewaga LinkWithin. Łatwiej o pomoc, teoretycznie większą pewność działania i przyszłość ma serwis popularny... Folksr, choć nie jest pierwszoplanowym projektem autora działa, jest funkcjonalny, ale ostatnie zmiany były dawno temu, a ilość nowych blogów, które z niego korzystają nie powala. Niemniej autor zapewnia, że serwis ma się dobrze. PodsumowanieOstatecznie moim zdaniem wygrywa Folksr przewagą 5 punktów do 2 (w kolejnych 2 punktach remis). Dla jasności: nie jestem w żaden sposób związany z Folksr. Po prostu go lubię, używam i wydaje mi się, że jest ciekawą polską alternatywą dla LinkWithin. Dodatkowo o większych możliwościach.
niedziela, 17 kwietnia 2011
Przyjeżdżasz na konferencję, wpadasz do pokoju hotelowego, znajomi już powinni być, ale czy faktycznie dojechali? Jeśli poruszasz się bez mobilnego internetu, masz mało wygodny Internet w telefonie, uruchomionego laptopa i nie spięte te dwa urządzenia z jakiegoś powodu, czy recepcja hotelowa jest daleko lub przeżywa oblężenie, to można to sprawdzić wykorzystując fakt, że zwykle hotelowe systemy dostępu przepuszczają zapytania (i odpowiedzi) DNS. Teraz jest to jeszcze prostsze, bo nie trzeba samemu ustawiać tunelu DNS. O ile tylko znajomi korzystają z Twittera lub Identi.ca... Prostą w użyciu, nie wymagającą logowania i publicznie dostępną bramkę Twitter/Identi.ca -> DNS zapewnia serwis Any.IO. Można pobrać ostatni status użytkownika, ostatnich 10 statusów, informacje o użytkowniku i... to w zasadzie tyle (przykłady na stronie). Wszystko w trybie tylko odczyt - nie ustawimy swojego statusu (dziwnym nie jest, wymagałoby podania hasła), ale czasem może być przydatne. Oczywiście to tylko namiastka tunelu i ciekawostka (ale bardzo wygodny gotowiec), jeśli ktoś szuka więcej informacji to więcej o tunelowaniu ruchu w zapytaniach DNS jest tutaj (ang.; nie bawiłem się, ale wygląda sensownie i sporo przydatnych linków). PS. Wszyscy piszą disclaimery nt. legalności tego typu rozwiązań. IANAL, ale IMVHO jeśli jesteśmy klientem hotelu, a zapytania DNS są przepuszczane, to nie jest to nieuprawniony dostęp. A już na pewno nie pojedyncze zapytanie w formie prezentowanej przez Any.IO.
wtorek, 01 marca 2011
Przeczytałem i na początku nie uwierzyłem. Po chwili uwierzyłem i czym prędzej zmieniłem opis jednej z kategorii (zgadnij której i jaki był), który niedawno (ale zupełnie nie pamiętam kiedy...) dodałem, bo sprawa nie jest oczywista. Krótko i punktami:
UPDATE: Forma jest luźna, a że będą liczne aktualizacje (od tej pory - na końcu listy nowe), więc po prostu: ostatnia aktualizacja 04.03.2011 07:50.
sobota, 19 lutego 2011
Od jakiegoś czasu zauważyłem sporą ilość wejść z wyszukiwarek na tego bloga z fraz prawo ironii losu, prawa ironii losu itp. W różnych możliwych odmianach, z różnymi błędami (bo odmienić słowo ironia to nie taka prosta sprawa, c'nie?) itd. Oczywiście wszystko celowało we wpis o ironii losu wg Metro, w którym słowa prawo i ironia się pojawiają, ale tylko tyle ma to wspólnego z tematem. Zrobiłem klasycznego WTF?! i starałem się wyjaśnić, o co chodzi. Po pierwsze, czemu ludzie to wpisują, po drugie, o co naprawdę chodzi, bo o prawach ironii losu to ja pierwszy raz w życiu słyszę. Niestety, wyszukiwarka (G ;-)) uparcie nie zwracała nic, co by wyjaśniało sprawę, przynajmniej pierwszych wynikach. Do dziś. Okazuje się, że PZU ma nową kampanię, którą ktoś z agencji reklamowej "kreatywnie" oparł o prawa ironii losu. Ciekawe, czy ten nowy, błędny zwrot się przyjmie (stawiam, że tak, bo ludzie jakby podchwycili), bo do tej pory nazywało się to po prostu prawa Murphy'ego... Fajny przykład na nie do końca poprawne działanie algorytmów w wyszukiwarkach i na to, że nie warto ograniczać się do jednej wyszukiwarki. Ja, mając dość Google, ale i świadomość, że bez Google ciężko, po raz kolejny robię podejście do czego innego. Tym razem jest to Dogpile, który łączy wyniki różnych wyszukiwarek (w tym Google - taka ironia losu - "rezygnując' z Google, nadal z niego korzystam). UPDATE: Dodany cudzysłów przy słowie kreatywnie, bo nic nowego (poza nazwą). Wszystko ulega rozkładowi w najmniej odpowiednim momencie. Podobne, do "nowego" jeżeli coś ma się stać, to stanie się w najmniej odpowiednim momencie, prawda? Jest tu, tu i tu. I w sumie oryginał lepszy, bo i bardziej by pasował, i zgrabniejszy, i bardziej ogólny. Podobnie jak i prawa Murphy'ego. UPDATE2: Wspomniane w komentarzu dwa kolejne. Prawo ironii losu nr 72: Oraz prawo ironii losu numer 64:
|
Ostatnie wpisy
Staty
Nawigacja
O mnie
Kontakt
Linkownia
SMSsender - skrypt do wysyłania SMSów
Przydatne polecenia Linux
Filtry Adblock by rozie
Zasady
Blogroll
| |||||||||||||||||||||||||||||||||||||||||||||||||