Wpisy z tagiem: blox

wtorek, 01 maja 2012

Na wstępie wyjaśnienie, skąd ten wpis. Na forum Blox co jakiś czas pojawiają się osoby, które straciły dorobek paru lat życia. Znaczy takie, których blog - z różnych przyczyn - przestał być dostępny. I zniknęły cenne wpisy (pół biedy, bo to ludzie czasem mają zapisane lokalnie) oraz jeszcze cenniejsze komentarze. Widziałem narzekania na administrację Blox, gorzkie żale, próby wyciągania treści z cache Google itp. hardcore, na dodatek nie zawsze skuteczny. Wszystko niepotrzebnie, bo ww. opisanym tragediom[1] można w prosty sposób zapobiec. Oczywiście problem nie dotyczy tylko Blox, tak samo może zdarzyć się na innych platformach.

Trzeba uświadomić sobie dwie rzeczy. Po pierwsze, blog, a dokładnie jego zawartość jest treścią tworzoną samodzielnie, przez długi okres czasu, trudno odtwarzalną. Szczególnie, jeśli uwzględnimy komentarze. Po drugie, żaden serwis, a już na pewno nie darmowy, nie daje specjalnych gwarancji na to, że dane nie znikną. Jasne, zwykle nie znikają. Co więcej, jeśli nawet znikną, to zwykle administracja serwisu ma backup, który może przywrócić. Jednak awarie i błędy ludzkie (samodzielne skasowanie notki lub bloga) się zdarzały, zdarzają i będą zdarzać.

Przed takimi sytuacjami można w prosty sposób się zabezpieczyć robiąc samemu bakcup swojego bloga. Szansa, że nastąpi awaria krytyczna awaria w dwóch różnych miejscach, jest pomijalna. Tak naprawdę samo jednorazowe skopiowanie to jedno polecenie, jeśli chcemy zautomatyzować, warto skorzystać z prostego skryptu. Wybrałem wariant najprostszy, z użyciem programu [i]wget[/i], dostępnego w każdej dystrybucji Linuksa[2], który powinien działać na każdej platformie blogowej (udostępniającej wszystkie wpisy bez logowania), a tworzy backup, który można bezpośrednio wgrać na dowolny serwer WWW i treść będzie od razu dostępna i wyglądająca praktycznie identycznie, jak na blogu. Oczywiście po takim przywróceniu działać będzie tylko odczyt, bez możliwości dodawania komentarzy itp. Co prawda średnio da się z tego automatycznie przywrócić w pełnej formie czy przenieść na inny silnik blogowy, ale najważniejsza rzecz, czyli treść, jest zachowana.

Backupowane są strony z wpisami (i oczywiście komentarzami), hostowane lokalnie zdjęcia i skrypty JS. W przypadku Blox także te strony statyczne, do których jest "przejście" przy pomocy linków. Nie są bacupowane strony, do których nie ma przejścia, linkowane strony, materiały umieszczone na zdalnym hostingu (np. muzyka umieszczona na soundcloud). Najlepiej i najprościej uruchomić i samemu sprawdzić, co się pobrało. Przy zmianie szablonu i linkowań może rzecz jasna dojść do zmiany zawartości nowych backupów.

Koniec tego przydługiego, ale koniecznego moim zdaniem wstępu. Prawda jest taka, że najsłabszym ogniwem jest człowiek i jeśli nie uruchomi się automatycznego backupu, to w najpotrzebniejszym momencie danych nie będzie. A samo się nie włączy. Czyli klasyczne ludzie dzielą się na tych, którzy robią backupy i tych, którzy będą je robić.

Do rzeczy. Aktualnie korzystam z polecenia:

wget -q -m -p -E -k http://rozie.blox.pl

Opcje (krótko): q - brak wyświetlania wyjścia, m - mirror, p - ignorowanie poziomu rekursji, E - konwersja plików do HTML niezależnie od rozszerzenia, k - konwersja linków na lokalne. Bardziej szczegółowy opis każdej opcji w pomocy programu.

Cały skrypt dla Linuksa, który można dodać do crona, żeby raz na jakiś czas się uruchamiał - poniżej. Wersja moja, trzeba sobie dostosować. Łatwo daje się przerobić na backupowanie kilku blogów.

Mam nadzieję, że będzie parę tragedii mniej. Chętnie usłyszę uwagi do tego sposobu i propozycje poprawy. Jakby ktoś chciał popełnić dokładny opis dla Windows, to zapewne ludziom się to bardziej przyda.

Przydatne linki (stąd wiem, że działa także dla Blogspot i Wordpress, a także podpatrzyłem kilka opcji):

Automatyzacja backupu bloga Blogspot

Automatyzacja backupu bloga Wordpress

[1] Tak, nabijam się. Zawartość bloga, konta na FB czy µbloga nie jest dla mnie tak ważna. Ale wiem, że niektórzy podchodzą do tego inaczej.

[2] Jest też wersja wget dla Windows, kiedyś używałem i działała. Oczywiście cały skrypt wymaga przepisania na platformę Windows, co nie jest trudne. Przydadzą się zapewne gzip dla Widnows oraz tar dla Windows, chyba, że od razu skorzysta się z jakiegoś natywnego archiwizera plików typu rar, zip itp.

piątek, 16 marca 2012

Trochę z rozpędu po ostatnim spojrzeniu na beznadziejną captchę na Blox, trochę zażenowany brakiem działania administratorów Blox w tak wydawałoby się prostej sprawie, trochę chcąc odkurzyć stare skrypty i znajomość Perla, trochę ze względu na zainteresowaniem tematem spamu, a w końcu trochę dla zabawy, postanowiłem zrobić przymiarkę do automatycznego wykrywania spamu na Blox. Chodzi o określanie, czy dany blog służy wyłącznie spamowaniu, oczywiście automatycznie, a co za tym idzie nie ze stuprocentową pewnością.

Administratorzy zapowiedzieli, że captcha zostanie poprawiona w kwietniu (trzymam za słowo i liczę na to, zapewne nie tylko ja), więc spamblogów nie powinno od tej pory przybywać. Zatem postanowiłem skupić się nie na liście nowozałożonych blogów, tylko na liście nowych wpisów, czyli aktywnych spamblogach. Co prawda pierwotny plan zakładał przeiterowanie się po wszystkich blogach i określenie prawdopodobieństwa, czy jest to spamblog, ale nie znalazłem niestety listy wszystkich blogów na Blox. Owszem, można próbować robić rzeźbę pod tytułem "przeiterujmy się po tagach", ale nadal nie daje to gwarancji uzyskania listy wszystkich blogów - wystarczy, że ktoś nie taguje i system nie dotrze do jego bloga, więc stanęło na tym, że obserwuję listę nowych wpisów i stamtąd biorę dane. Przy okazji oceniam nie tyle cały blog, co poszczególne wpisy, co może być przydatne.

Podejście pierwsze - pobierz i oceń. Na samym początku stwierdziłem, że będę pobierał wpis do oceny i oceniał na podstawie arbitralnych kryteriów. Pomysł szybko upadł - zmiany w algorytmie oceniania powodowały niekompatybilność z poprzednimi danymi, a zmiany były konieczne - wychodziły coraz to nowe kryteria i ich wagi. Wersjonowanie algorytmu przy ocenie nie pomagało, bo dane były tracone. OK, nie jest to wszystko aż tak proste, jak się wydawało na początku.

Podejście drugie - pobierz i zapisz jak najwięcej cech wyróżniających dla danego wpisu/bloga, a potem pomyśli się nad algorytmem. No niestety, zapisywanie dużej ilości danych może być ciekawe, szczególnie, że potem można sięgnąć do wiedzy ze studiów i określić poziomy istotności poszczególnych parametrów (albo popytać kumpla o gotowca, może jeszcze ma...). Wytrenuje się AI na próbce kontrolnej, a potem AI sama zrobi resztę. Brzmi fajnie, ale trochę overkill, poza tym, mało odporne na dołożenie kolejnych parametrów, gdyby przyszło mi do głowy ich wyciąganie.

Podejście trzecie, aktualne,kompromisowe - pobierz i zapisz istotne (wybrane arbitralnie przeze mnie) cechy wyróżniające dany wpis. Osobny skrypt ma algorytm procentowy, każda cecha może przyjmować wartości 0-100% prawdopodobieństwa bycia spamem. Następnie w zależności od ilości cech wylicz prawdopodobieństwo dla całego wpisu przy pomocy średniej ważonej. Rezultaty są dość interesujące.

Tutaj lista blogów, które sklasyfikowałem jako spamerskie z prawdopodobieństwem 80% i więcej. Format prawdopodobieństwo bycia spamem (%), spacja, link do bloga. Nie widzę (szybko patrząc) żadnego false positive, a wy? Aktualnie jest takich blogów 375 na 2404 wszystkich sprawdzonych blogów. Jasne, nie jest to cud techniki, ale przy dodaniu pewnych prostych whitelist myślę, że można spokojnie blokować automatem wszystkie blogi z prawdopodobieństwem od 70% w górę.

Szczegółów badanych cech oraz algorytmu nie chcę na razie opisywać, bo po co spamerzy mają się bronić? Jak będzie utrudnione zakładanie nowych blogów, to pomyślę o tym. Na razie cały czas zbierają się dane... Gdyby byli chętni do przeglądania wyniku w celu wychwytywania false positive'ów (wpisujcie miasta, które przeglądają ;-)), to mogę pomyśleć o wystawianiu listy spamów automatem co jakiś czas.

Całość napisana oczywiście w Perlu, główny moduł zbierający z użyciem WWW::Mechanize (genialna sprawa do crawlerów).

UPDATE: Drobny update statystyk z dnia 27.04.2012 - 13481 unikatowe blogi (wcześniej chyba były unikatowe wpisy, ale mniejsza), w tym 1094 do natychmiastowego wycięcia (80% i więcej). Dla porządku 70% i więcej to 2438 sztuki. Listy nie zamieszczam, bo zainteresowanie było znikome. A captcha nadal nie została poprawiona, choć koniec kwietnia...

środa, 22 lutego 2012

Od dłuższego czasu serwis blogowy Blox boryka się z plagą spamu. Słyszałem zapewnienia, że moderatorzy/admini walczą z tym zjawiskiem, ale wydaje mi się, że bez większych sukcesów, a nawet, że problem spamu się nasila. Jest to zjawisko dla wszystkich (poza spamerami) niekorzystne, a nierzadko na stronie głównej o pewnych porach spamy stanowią 30 i więcej procent wpisów.

Postanowiłem zerknąć na proces zakładania konta od początku. Pierwsze co rzuciło mi się w oczy, to prostota CAPTCHA. Być może parę lat temu wystarczało coś takiego, by odstraszyć spamerów, ale wojna trwa - istnieją narzędzia do automatycznego rozpoznawania nawet dość skomplikowanych CAPTCHA ze stosunkowo dużą pewnością (grubo ponad 50%). Niedawno nawet Jogger, który pozwalał właścicielowi bloga na mocne zmiany wyglądu CAPTCHA (kształt, wielkość, kolor), przy komentarzach dorzucił do niej litery obok cyfr, bo spamerzy się przebijali...

Żeby sprawdzić, czy nie przypadek, że CAPTCHA jest taka słaba, wcisnąłem F5, raz, drugi, trzeci... I okazało się, że trafiłem na powtarzające się słowa. Chwilę się pobawiłem i faktycznie, nie da się ukryć, CAPTCHA powtarza się i to - na oko - często. Postanowiłem sprawę zbadać dokładniej.

Sposób badania: uruchomienie przeglądarki, wyczyszczenie historii, w każdej serii 50 przeładowań strony (F5 lub ctrl-r), zapisanie wyników do pliku (każdy wynik w pojedynczej linii) w takiej kolejności, w jakiej się pojawiały. Żeby wykluczyć wpływ User Agent i czasu, każda seria wykonywana na różnej przeglądarce i w odstępie minimum kilkudziesięciu minut.

W pierwszej serii (przeglądarka chromium) 50 ciągów wyrazów wystąpiły 32 unikatowe ciągi, przy czym 4 wystąpiły trzykrotnie, 10 dwukrotnie, a 18 tylko raz. Dodatkowo rzuciła mi się w oczy prawdopodobna metoda powstawania wielu CAPTCHA - podział słowa na sylaby, połączone z ew. wyrzuceniem niektórych liter, a następnie wymieszanie tych slab. Przykładowo zykamu i kazymu (czyli muzyka), letefon, fontele i fonlete (czyli telefon), zetagagataze (czyli gazeta), lafiorka, fiorkala, fiorlaka (czyli kalafior).

Druga seria, kilkadziesiąt minut później na midori - 34 unikatowe ciągi, jeden wystąpił czterokrotnie, 13 dwukrotnie, 20 jednokrotnie. Wyrazy zdecydowanie powtarzają się między seriami - dla obu serii łącznie wystąpiło 46 unikatowych ciągów, 2 wystąpiły pięciokrotnie, 6 - czterokrotnie, 8 - trzykrotnie, 12 -dwukrotnie, 18 - jednokrotnie.

Ponieważ ciąg znaków pod którym można poprać losowany obrazek może być stały (z danego można korzystać wiele razy), postanowiłem uprościć sobie pobieranie i przeliczanie. Szybki skrypt, który przy pomocy wget pobiera zadaną ilość obrazków i zapisuje do kolejnych plików, a następnie sprawdzenie sum kontrolnych (md5) tychże plików. I tu ciekawostka - sumy kontrolne praktycznie się nie powtarzają. Sprawdziłem organoleptycznie i faktycznie - o ile wyrazy powtarzają się często, to praktycznie każdy plik jest binarnie inny. Czyli raczej mała ilość wyrazów raczej nie wynika z chęci cache'owania.

Dla porządku: dla 100 plików 3 miały takie same sumy kontrolne, a kolejne 5 sum występowało dwa razy. Powtórzyłem eksperyment dla 1000 plików. Pojawiło się 611 unikatowych sum kontrolnych, jedna z sum występowała 7 razy, jedna 6, sześć wystąpiło 5 razy, cztery - 20 razy, trzy - 53 razy, dwie - 188 razy i jedna - 342 razy.

Nie sprawdzałem dokładnie, czy dany wyraz w CAPTCHA koreluje z ciągiem w treści (na oko nie), ani z jaką skutecznością zadziała automatyczne rozpoznawanie, ale przy tak częstym powtarzaniu się ciągów znaków i plików nie ma to znaczenia - wygląda, że baza jest za mała, a przekształcenie zbyt proste i można spokojnie stworzyć skrypt, który porówna sumę md5 wygenerowanego pliku z arbitralną bazą.

O problemie pisałem wstępnie na forum, póki co bez odzewu. W każdym razie liczę na to, że wpis zmotywuje administratorów blox do załatania ewidentnej dziury w zakładaniu nowych kont. Obecne likwidowanie spamerskich blogów przypomina wylewanie wody z łódki, zamiast załatania w niej dziury, przez którą wody nabiera.

Oczywiście najlepsze byłoby podpięcie jakiegoś znanej, sprawdzonej implementacji CAPTCHA, zamiast wymyślania koła od nowa (i to sugestia dla tych, którzy chcą stosować tego typu rozwiązanie) ale wydaje się, że nawet z istniejącą implementacją można prosto zadziałać w taki sposób, że stanie się ona choć w części efektywna. Przede wszystkim mam na myśli zwiększenie bazy słów i ilości przekształceń.

Obok złych wiadomości są też i dobre - co prawda problem nie jest to Blox, tylko ogólnie dotyczy konto.gazeta.pl, ale - jak wynika z korespondencji z administratorami Blox - jest znany i ma być najdalej w kwietniu poprawiony. Pozostaje uzbroić się w odrobinę cierpliwości i liczyć na to, że po załataniu dziury uda się skutecznie pozbyć spamerów. W tej chwili bywa tak, że 100% wpisów na głównej stanowią spamy...

środa, 21 września 2011

Na informację o serwisie doLoop natknąłem się podczas lektury bloga o najlepszych dodatkach do blogów. W skrócie jest to wymiana ruchu - ja linkuję kogoś, ktoś linkuje mnie. Z grubsza tematycznie, tzn. można wybrać, jaką tematykę chcemy linkować i określamy kategorię tematyczną własnych wpisów. Postanowiłem wypróbować, jak to działa i co to daje.

Zaczęło się niezbyt dobrze. Po pierwsze, na stronie serwisu doLoop nie ma regulaminu (AKA ToS). Jest FAQ, które coś tam wyjaśnia, ale normalnego regulaminu nie ma. Niefajnie, bo nie musi być nie wiadomo co, ale wystarczyłoby w kilku punktach opisać warunki korzystania z serwisu.

Po drugie, zamieszczanie linka w serwisie jest całkowicie ręczne. Po prostu trzeba wklepać linka, opis, tagi. Wszystko ręcznie, bez możliwości skorzystania z automatów typu javascript i zamieszczenia danych typu tytuł czy tagi automatycznie (OK, tytuł może zaciągnąć automagicznie z URLa). Co przecież jest jak najbardziej wykonalne - Folksr to potrafi. Marnym pocieszeniem - przynajmniej dla mnie - jest możliwość dodania kanału RSS i wybierania postów do dodania z niego.

Na dodatek wymagane jest dodanie zdjęcia. Po prostu i zwyczajnie nie da się zamieścić wpisu bez zdjęcia. Na dodatek zdjęcie musi pasować do treści. W praktyce pewnie czeka mnie szukanie jakichś zdjęć na licencji Creative Commons, albo - raczej - public domain, bo CC wymaga podania autora o co trudno w tej sytuacji. Za robieniem własnych fotek/zrzutów nie przepadam. Nawet do wpisów, co dopiero do zajawek o wpisach.

Po trzecie, mail z potwierdzeniem odbioru prośby rejestracji, który przyszedł, miał skopane pl-znaki w temacie, co wygląda delikatnie mówiąc mało profesjonalnie. Mail z potwierdzeniem dodania do serwisu, który dotarł po około 12 godzinach - to samo. No ale skoro dobrnęliśmy do tego momentu, to kontynuujmy...

Pozytywem jest bardzo dużo opcji wyglądu widgetu. Powiedziałbym nawet, że za dużo i chyba wolałbym podział na widok podstawowy i zaawansowany. Ale domyślne ustawienia praktycznie nie wymagały korekty (no dobrze, rozmiar zdjęć zmieniłem, ale to podstawa).

Testowe zamieszczenie pierwszego wpisu - wypełnianie ręczne dla pojedynczego jest niby do przeżycia, ale na dłuższą metę będzie męczące jak dla mnie - m. in. dlatego nie korzystam z Wykopu czy nie dodaję wpisów do katalogu Flattr. Bardzo fajną rzeczą jest możliwość podania linka do zdjęcia, a następnie prostego wykadrowania i - w razie potrzeby - pomniejszenia w przeglądarce. Przynajmniej nie trzeba uruchamiać edytora grafiki.

Za to czas moderacji wpisu to jakiś koszmar - rozumiem, że jest robione ręcznie i uprzedzają w FAQ moderacja postów trwa przeważnie do 12 godzin, ale kilkadziesiąt godzin to trochę przesada. Przynajmniej na początku drażni, kiedy się czeka na efekty, potem nie przeszkadza w ogóle - przestałem zwracać uwagę na czas moderacji.

Inne niefajne rzeczy:

  • Po zgłoszeniu błędu zero informacji o przyjęciu, zero informacji, czy będzie naprawiany i kiedy.
  • Błędy ortograficzne - po dodaniu do czarnej listy proszę odświerzyć stronę.
  • Mimo zaznaczenia przy zakładaniu konta, żeby "atrakcyjnych dziewczyn" nie pokazywało i wyłączania kategorii Sexy, zdarzają się praktycznie gołe dupy na zdjęciach. Znaczy w stringach. Można to oczywiście blokować blacklistą, ale jakby nie takie jest założenie. I niestety nie można zablokować konkretnego wydawcy w całości.
  • Problemy z pl-znakami - występują i w mailach, i przy pobieraniu danych o tytule wpisu. To pierwsze to wina doLoop, to drugie może być winą Blox i archaicznego kodowania pl-znaków.

Nie miałem przypadku, by dodawany wpis został odrzucony, za to męczące jest ograniczenie w dodawaniu wpisów - w praktyce mogłem dodawać po jednym wpisie dziennie - przypuszczam, że chodzi o swoiste zabezpieczenie antyspamowe. Rozrzut CTR (stosunek wyświetleń reklamy danego posta do wejść) mam spory, bo od ok. 1,3% (beznadziejne zdjęcie) do ok 20% (świeży wpis, CTR spada z czasem).

Wyniki, czyli część najważniejsza, bo widget dodaje się w celu zwiększenia ruchu na stronie (albo przyciągnięcia nowych czytelników, jak w moim przypadku). W FAQ piszą przeważnie można liczyć na od 150% do 200% zwiększenia ruchu na twojej stronie po zainstalowaniu widgetu doLoop. Na mój gust o zero za dużo, przynajmniej na tym blogu. 20% jest za to jak najbardziej osiągalne. Wiele zależy od dodanych wpisów - liczy się i opis (tu nie szalałem, po prostu tytuł z bloga), i zdjęcie. W testowym okresie, wynoszącym 14 dni, unikalne wejścia z doLoop stanowiły ok. 15% wszystkich UU.

Ogólne zadowolenie - 4/10, na razie zostawiam to, co jest, zobaczę jak będzie wyglądało w dłuższym okresie (będzie aktualizacja statystyk). I rozglądam się za alternatywami.

UPDATE: No i jednak doLoop okazał się happeningiem, jak wskazywały na to niektóre rzeczy typu brak ToS czy orty. Od paru dni(!!!) strona główna pokazuje Błąd bazy danych!! Znaczy się do piachu.

czwartek, 14 lipca 2011

Zauważyłem, że ostatnio sporo ludzi z Blox interesuje się wspomagaczem linkowania LinkWithin (znanego również jako You might also like). Rozwiązanie, choć proste i popularne, niekoniecznie jest najlepsze. Postanowiłem szybko porównać LinkWithin i Folksr, którego integrację z Blox opisywałem kiedyś (patrz też wpis o Folksr na wiki Blox).

Oba rozwiązania są darmowe, działają z różnymi systemami blogowymi i mają na celu proponowanie ludziom podobnych - czyli potencjalnie również interesujących - wpisów. Parę cech różniących oba rozwiązania:

LinkWithin:

  • bierze pod uwagę temat, tagi i treść (chyba w tej kolejności, patrząc na efekty u mnie temat jest bardzo istotny)
  • potrafi sam dobrać wygląd w zależności od dostępności bądź braku zdjęć w linkowanych wpisach
  • linkuje tylko do wpisów z danego bloga
  • brak kontroli nad działaniem
  • prosta konfiguracja i implementacja
  • nieznany dokładny algorytm
  • brak statystyk (nieco widać w zwykłych, zewnętrznych)
  • tylko wersja angielska
  • bardzo popularny

Folksr:

  • bierze pod uwagę tylko na tagi (ew. kategorie; ogólnie: przekazane wprost parametry)
  • jednoznaczne, stałe dla całego serwisu określenie wyglądu linkowanych wpisów
  • linki z wszystkich blogów w Folksr, tylko wybranych ("znajomych"), tylko tych, które pozwalają pokazywać także nasze linki lub tylko z naszego bloga (wybieramy samodzielnie)
  • pełna kontrola nad działaniem
  • stosunko skomplikowana konfiguracja i implementacja (patrz opis na wiki)
  • w pełni znany algorytm
  • statystyki wejść i wyjść z użyciem Folksr (osobno wejścia i wyjścia dla każdego wpisu)
  • polska i angielska wersja językowa
  • mało popularny

Ocena

Pierwsze dwa punkty to moim zdaniem remis - jednemu może bardziej odpowiadać automatyka, drugi będzie wolał większą przewidywalność. Po prostu rzecz gustu. Niestety, na Blox trochę psują efekt kiepsko zaimplementowane tagi.

Punkt trzeci to zdecydowana przewaga Folksr - w prosty sposób pozwoli na wymianę ruchu między kilkoma swoimi serwisami, albo serwisami o podobnej tematyce, jeśli tylko korzystają z Folksr.

Punkt czwarty - punkt dla Folksr. Nieduży, bo nie każdemu zależy na kontroli, ale jednak.

Punkt piąty - LinkWithin kliknąłem w minutę. Z Folksr było więcej zabawy, choć tak naprawdę nie jest to trudne, jest opisane i robi się to raz... Punkt dla LinkWithin.

Punkt szósty - kolejny punkt dla Folksr, choć znowu raczej nie dla każdego znajomość algorytmu będzie istotna.

Kolejne dwa punkty to zdecydowana przewaga Folksr. Statystyki są fajne, od razu widać, do których wpisów wchodzą ludzie, i z jakich wychodzą przy pomocy linków. Z serwisu zawsze prościej i wygodniej korzystać po polsku. Szkoda jedynie, że nie można wprost wybrać języka, wybór jest dokonywany automatycznie na podstawie ustawień w przeglądarce. UPDATE: jak trafnie zauważono w komentarzu, można samemu wybrać język.

Ostatni punkt to przewaga LinkWithin. Łatwiej o pomoc, teoretycznie większą pewność działania i przyszłość ma serwis popularny... Folksr, choć nie jest pierwszoplanowym projektem autora działa, jest funkcjonalny, ale ostatnie zmiany były dawno temu, a ilość nowych blogów, które z niego korzystają nie powala. Niemniej autor zapewnia, że serwis ma się dobrze.

Podsumowanie

Ostatecznie moim zdaniem wygrywa Folksr przewagą 5 punktów do 2 (w kolejnych 2 punktach remis).

Dla jasności: nie jestem w żaden sposób związany z Folksr. Po prostu go lubię, używam i wydaje mi się, że jest ciekawą polską alternatywą dla LinkWithin. Dodatkowo o większych możliwościach.

niedziela, 24 października 2010

Bardzo lubię tagi jako znaczniki do wpisów, bo to chyba najszybsza metoda na znalezienie wpisu (w swoich wpisach), poza tym, można w prosty sposób kierować do podobnych tematycznie wpisów, także między platformami (np. z wykorzystaniem Folksr; opis integracji Blox i Folksr tutaj), więc bardzo ucieszyłem się, gdy Blox je wprowadził.

Moja radość nie trwała długo - mój mały system półautomatycznego przypisywania tagów (AKA tag-ego-rise) szybko dobił do limitu 100 tagów. Później limit został zwiększony do 250, ale i to nie starczyło na długo. Podobno istnieje jakieś uzasadnienie limitu tagów dla danego bloga. Więcej, nawet nie wiedząc nic o bebechach Blox potrafię sobie wyobrazić powody limitowania. Ale czemu tylko 250? Nic to, przyjmijmy to za ograniczenie techniczne. I w sumie da się przeżyć...

Kolejna sprawa to pisownia - obecny system, gdzie każdy tag jest globalny dla wszystkich blogów na Blox i może być dodany tylko w jednej wersji (duże i małe litery) wymusza arbitralne decyzje, czy będzie Safari (przeglądarka) czy safari (polowanie), Opera (przeglądarka) czy opera (muzyka, budynek). Kto pierwszy ten lepszy (no dobrze, admini mają możliwość interwencji, ale...), ale dzięki temu mamy tagi typu Policja (na pewno nikt z ekipy JP nie dodawał tagu), Katastrofa (taka kaczka?), Rock (musiało to być potężne brzmienie) i Wpis (Wpis na Blogu - brzmi dumnie, niestety blog jest małą). Też w sumie niekrytyczne, choć przydałaby się opcja pozwalająca na prezentowanie wszystkich tagów bez użycia wielkich liter (albo wszystko kapitalikami). Może nawet da się to w CSS jakoś zrobić.

No dobrze, powyższe mają jakieś uzasadnienia techniczne. Ale jak wytłumaczyć to, że z poziomu administratora bloga:

  • Nie ma sortowania tagów po ilości użycia w ramach danego bloga? I weź tu szukaj rzadko używanych tagów...
  • Nie można kliknąć tagu, żeby zobaczyć wszystkie wpisy na blogu (albo lepiej, listę ich tytułów), do których jest przypisany? Sama funkcjonalność istnieje, bo kliknięcie tagu pod wpisem dokładnie tak działa... No ale nie będę się w greasemonkey bawić, żeby łatać dziurę.

Pisząc oczywiście mam nadzieję, że podziała to stymulująco na developerów i późno bo późno, ale dorobią. Lepiej późno, niż wcale.

poniedziałek, 20 września 2010

Jak pisałem jakiś czas temu, Flattr jest dostępny dla każdego jako open beta. Liczyłem na szybki wzrost użytkowników i contentu i... zawiodłem się. Wzrost nie jest szybki. Czyli pozostają w mocy ostatnio opisane wady - brak contentu (szczególnie brak contentu polskiego) i stosunkowo wysoka cena. Szczególnie, że jest to cena za możliwość testowania (czytaj: wykonywania pracy na rzecz serwisu, aspekt mojej zabawy pomijam ;-)) - w takim wypadku 2 euro to IMO za dużo.

Jasne, mógłbym to potraktować jako przelewanie pieniędzy na projekty opensouce'owe, ale... na razie zagłosuję nogami, a raczej portfelem - zależy mi na funkcjonalności pt. możliwość przeznaczenia dowolnej kwoty (OK, z dokładnością do pełnych dziesiątek eurocentów, ew. nawet 1 euro jako minimum, jeśli musi być minimum) na dany miesiąc i bez niej nie do końca widzę sens. Osobiście wolałbym opłatę minimalną za flattrnięcie typu 1 eurocent, bo w tej chwili można dać 2 euro i nabić $BIGNUM flattrnięć, co też IMO nie jest dobre, jeśli Flattr miałby być konkurentem Wykopu.

Nie przekreślam w całości projektu, bo sama idea okrutnie mi się podoba, ale z dalszą zabawą z tym projektem wstrzymuję się minimum do końca roku (chyba, żeby jakieś gwałtowne zmiany zaszły). Button zostaje (nieaktywny) - przynajmniej na razie, jako reklamówka serwisu, może kogoś zainteresuje. Przy okazji przypominam opis jak uruchomić Flattr na Blox, może się komuś przyda.

niedziela, 25 lipca 2010

W końcu udało mi się zintegrować Flattr, czyli serwis do mikropłatności i Blox. Nie było to takie proste, na jakie wyglądało, więc pozwolę sobie zamieścić krótkie howto.

Pierwsza sprawa, to dodanie prostego javascriptu do Ustawienia -> Wpisy -> Dodaj pod każdym wpisem. Niestety, Blox ma buga i tagi typu {tytul} są rozwijane tylko przy pierwszym wystąpieniu. Przynajmniej w javascripcie. A akurat pola tytuł to ja już używam...

Podpatrzyłem obejście z widgetów Wykopu i Facebook, które wstawia Blox - skoro to javascript, to można się odwołać do tytułu przez encodeURIComponent(document.title); Bingo. No prawie, bo nadal nie działa. Nadal nic nie mówiący Error w widgecie Flattr.

Doładowałem konto na Flattr i postanowiłem dodać wpis ręcznie, z tymi samymi parametrami. Okazało się, że zmienna flattr_dsc jest obowiązkowa, a tymczasem wywaliłem ją, bo nie miałem pomysłu, co tam wstawić.

Ostatecznie działający kod wygląda następująco:

<script type="text/javascript">
var flattr_uid = '10901'; // TWOJE Flattr ID
var flattr_tle = encodeURIComponent(document.title); // Tytuł strony
var flattr_dsc = 'Blox blog entry ID: {id}'; // nie jestem pewien, czy musi być unikatowe, ale tak - będzie
var flattr_cat = 'text';
var flattr_lng = 'pl_PL'; // skoro Blox, to pewnie po polsku piszesz
var flattr_tag = '{tagi_b}'; // lista separowanych przecinkiem tagów
var flattr_url = '{link}'; // link do wpisu
</script>
<script src="http://api.flattr.com/button/load.js" type="text/javascript"></script>

Gdyby ktoś wykorzystywał już zmienną {link} to najprawdopodobniej zamiast niej użyć encodeURIComponent(location.href); Oczywiście zadziała tylko w javascript.

Parametrów jest nieco więcej, opisane są w API Flattr, można choćby zmieniać wygląd przycisku na compact.

Nie jest zupełnie różowo - nie działa mi w jednym wpisie. Podejrzewam, że przez to, że był dodany ręcznie, z identycznymi parametrami. Nie widzę też wpisów dodanych w My latest things. Być może zmieni się to, gdy ktoś flattrnie wpis.

środa, 21 lipca 2010

Obiecałem sobie, że po roku korzystania z Blox zrobię porządne porównanie obu platform blogowych z którymi miałem do czynienia, czyli Blox i Jogger. Pierwszy opis był na gorąco, drugi jakoś po kwartale, teraz pora na ten właściwy.

Użytkownicy.

Obie platformy pozwalają na dodanie kolejnych użytkowników. W przypadku Blox mogą oni być typu czytelnik, użytkownik, administrator, przy czym dwaj ostatni mogą zamieszczać notki, a ostatni dodatkowo zmieniać ustawienia i wygląd. W przypadku Joggera: czytelnik i administrator. Dodatkowo Jogger pozwala na ustawienie poziomów dostępu dla wpisów i użytkowników - część wpisów może być widoczna dla wszystkich, a pozostałe tylko dla określonych grup użytkowników. Blox to tak naprawdę wybór między blogiem publicznym a takim dla zamkniętej grupy userów.

Kontrola komentarzy.

Większość rzeczy opisanych we wpisie po kwartale użytkowania nadal jest aktualna. Jeśli chodzi o zabezpieczenia przed niechcianymi komentarzami i użytkownikami, to nadal Jogger nie ma nic sensownego do zaoferowania (można blokować konkretne IP, można wymusić komentarze tylko zalogowanych), a Blox ma chyba wszystko, co można wymyślić - od moderowania trackbacków i komentarzy, przez blokady na IP (wildcard) czy login, co w połączeniu z wymuszeniem zalogowania do serwisu przed dodaniem komentarza jest skuteczne. Plus Blox ma listę administracyjną (loginy, hosty, słowa zabronione), którą można włączyć, jeśli ktoś chce gotowca, a nie chce tego pilnować samodzielnie. Oba serwisy oferują captchę dla niezalogowanych, w przypadku Joggera jest prostsza (nawet zbyt prosta - kiedyś sprawdzałem i prymitywny automat trafia na niektórych blogach nawet w połowie przypadków), ale użytkownik ma możliwość zmiany jej parametrów. W przypadku Blox jest trudna (wręcz zbyt trudna) i użytkownik nie ma wpływu na jej wygląd. Oba serwisy pozwalają na określenie wyjątków w sposobie ochrony dla pojedynczych wpisów. Jeśli komuś zależy na kontroli komentarzy i trackbacków, to zdecydowanie powinien wybrać Blox - Jogger nie gwarantuje kontroli, istnieją proste sposoby na obejście istniejących blokad.

Kategorie wpisów i tagi.

Obie rzeczy występują na obu platformach, ale na obu mają wady.  W przypadku Blox jest wsparcie dla tagów w samym systemie, ale... jest też limit na ilość tagów. Niestety niski (dla mnie zbyt niski), bo 250 per blog. W praktyce robią się z tego takie mini - kategorie, a nie po prostu tagi. Znaczy niby jest, ale nie do końca. Jogger nie limituje w żaden sposób ilości tagów, ale też w żaden sposób system ich nie wspiera. Przypisałeś sobie tagi do wpisu i co z tego? Masz je przypisane, ale nic to nie daje. Bez zewnętrznego systemu ani rusz. Tak czy inaczej korzystam w obu przypadkach z niezbyt niestety żywego (ale nie całkiem martwego) Folksr. Jeśli ktoś może polecić serwis podobny do Folksr, to poproszę info (nie, nie szukałem, lenistwo wzięło górę).

Edycja i wygląd.

Jeśli chodzi o możliwości zmian wyglądu, ustawień itd., to Jogger pozwala praktycznie na wszystko, bo jeśli chodzi o notkę, to edytujemy goły HTML (lub Markdown), a korzystamy z wbudowanych tagów i HTML (szablony). Wymaga to jednak sporo czytania opisu tagów, dumania nad ich właściwym zastosowaniem i poznania tychże wbudowanych tagów. Plus, niektórych tagów zwyczajnie brakuje - np. nie ma możliwości podania tekstu do wpisania na jabberze w celu śledzenia komentarzy do konkretnej notki bez zabaw z JS. Z kolei na Blox można w niewielkim - choć dla wielu wystarczającym - zakresie dostosować wygląd po prostu przez wybór opcji w menu. Mamy też niewielkie (ale tak naprawdę całkiem wystarczające) możliwości dodawania własnych fragmentów kodu HTML w szpalcie bocznej oraz pod każdym wpisem. W tym ostatnim polu możemy korzystać także z kilku wbudowanych tagów (nowość, ostatnio tego nie było), dzięki czemu można wprowadzić jakąś interakcję z użyciem tytułu wpisu, daty, tagów itp. Przydatne. Pojawiła się też możliwość skorzystania z zupełnie nowego szablonu w Blox. Niestety, do tej pory nie doczekałem się instrukcji (były jakieś zawirowania z jej powstawaniem), więc nic więcej nie napiszę, bo z braku czasu na domyślanie się i eksperymenty nie testowałem. Upraszczając: Jogger to pełna kontrola nad wyglądem (porównywalna z własnym hostingiem), Blox - większość rzeczy jakoś da się zrobić (przynajmniej optycznie), choć czasem będzie to trudne.

Miejsce.

Jogger jako platforma blogowa czegoś takiego jak miejsce nie oferuje, po prostu. Bo jak inaczej nazwać 1 MB (jeden megabajt) powierzchni? Starczy na 5-10 fotek. Podstawowe skrypty, jakieś drobiazgi. Jeśli chcesz zamieszczać np. zdjęcia - musisz korzystać także z innego serwisu (np. Flickr). Blox oferuje - przynajmniej teoretycznie, patrząc na to ogłoszenie - nielimitowaną powierzchnię - 30 MB na starcie i wzrost maksymalnie 5 MB tygodniowo. Za to pozwala na zamieszczanie tylko wybranych typów plików. Jeśli ktoś chciałby dodawać zdjęcia bezpośrednio na bloga - zdecydowanie Blox, choć pojawiły się głosy, że dla niektórych nawet te 25-50 zdjęć tygodniowo to mało.

Dodawanie wpisów.

Jeśli chodzi o zamieszczanie wpisów i komentarzy, to Blox oferuje szeroki wachlarz możliwości dodawania wpisów - poprzez przeglądarkę i wbudowany edytor (z możliwością wyboru edytora od gołego HTML po bardziej WYSIWYG), przez SMS, MMS, maila. Istnieje też - IMO całkiem fajny, choć niewolny od wad - bloxer2, którego recenzję popełniłem i z którego od tamtej pory korzystam. Wsparcie dla jabbera w Blox jest szczątkowe niestety (tylko jabber.gazeta.pl) i raczej się to nie zmieni ze względu na niszowość zapotrzebowania (hmm, naprawdę? blip, identi.ca i inne μblogi mają, statystyk wykorzystania co prawda nie znam, ale...). Z kolei Jogger to albo wbudowany edytor, albo jabber (do wszystkiego, od wpisów po komentarze) i oczywiście klepanie gołego HTML (jest podgląd, ale nie działa idealnie). Jeśli komuś bardzo zależy na jabberze, to zdecydowanie Jogger. Jeśli interesuje kogoś coś poza jabberem, chce mieć WYSIWYG - tylko Blox.

Zarabianie na blogu.

Jeśli chodzi o modny ostatnio temat czyli zarabianie na blogu (dla jednych to poważny temat, dla innych po prostu kolejne a co to jeszcze w tej sieci mamy?), to Jogger oferował integrację z Linklift (używam czasu przeszłego, bo Linklift co prawda ostatnio odżył, ale za to AFAIK wypiął się na dotychczasowe automaty, więc wsparcie jest iluzoryczne), a Blox defaultowo umożliwia umieszczanie reklam Adtaily. Oczywiście do Joggera można także podpiąć Adtaily, ale nie wystarczy po prostu przeklikać opcji, jak to ma miejsce w Blox. Praktyka pokazuje, że zarabiać można blogach na obu platformach. Plus Joggera dla myślących poważniej o zarabianiu jest taki, że można podpiąć własną domenę. Z drugiej strony przykład Kominka pokazuje, że wcale to nie jest potrzebne (oraz, że wspólna platforma blogowa wystarcza i tak do czasu)...

Rozwój.

Jogger w obecnym kształcie jest platformą nierozwijaną (jak przyznają autorzy od dwóch lat praktycznie nikt nie dotykał kodu), Blox żyje stałym, niespiesznym rytmem, pojawiają się nowe - mniej lub bardziej przydatne - funkcjonalności. Widać to porównując blogi obu platform: Jogger i Blox.

Pisząc to podsumowanie nie wypada nie wspomnieć o zapowiedzianej nowej wersji czyli Jogger 3.0. Niestety, poza zapowiedzią powstania i tym, że prace trwają niespecjalnie coś wiadomo (a chętnie podlinkowałbym tu jakiś raport z prac, ale nic takiego się oficjalnie nie pokazało). Ma być lepiej, w szczególności więcej narzędzi do moderowania po stronie autora bloga i być może mniej wtrącania się ze strony autorów serwisu. Tyle przynajmniej usłyszałem w rozmowie z jednym z autorów Joggera. Oczywiście, jeśli 3.0 ujrzy światło dzienne, bo na oficjalnym blogu Joggera nadal zero informacji.

Z drugiej strony w rozmowie o 3.0 nadal widoczne było podejście, że autorzy blogów "nie są u siebie" i jakieś związanie autorów platformy blogowej z treścią na serwisie, nawet jeśli to czyjeś komentarze czy blogi. Dla mnie dyskwalifikujące - zgadzam się, że nie wszystkie wpisy muszą trafiać na główną, ale jeśli autor chce trollować z jakiejś marki sprzętu, obuwia, opisywać swoje poranne wypróżnienia, rozwiązania programistyczne czy pisać poezję - jego sprawa, jego wolność. Dopóki nie narusza prawa, oczywiście. Neutralność platformy blogowej to fragment neutralności sieci (modny temat ostatnio).

O wolności na Joggerze miałem nie pisać, i pisać nie zamierzam, ale... Z jednej strony autorzy Joggera twierdzą, że moderują wyłącznie zgodnie z regulaminem (i tych intencji nie neguję), z drugiej strony patrząc moimi oczami wygląda to inaczej, moderacja i sankcje nie są równe dla wszystkich użytkowników. Porozmawialiśmy prywatnie, przy okazji kolejnego szumu o trolle, myślę że zupełnie bez emocji i na luzie. Z jednej strony rozumiem intencje i akceptuję cele, z drugiej strony totalnie nie zgadzam się z metodami, oraz postrzeganiem niektórych spraw.

piątek, 07 maja 2010
Wszystko zaczęło się oczywiście od tego wpisu, w którym dowiedziałem się, że dostępna jest nowa wersja probramu Bloxer2. Ponieważ wielokrotnie narzekałem na bloksowy edytor, to postanowiłem dać mu szansę, tym bardziej, że z racji faktu, że jest napisany w Javie, ma szansę działać pod każdym systemem.
 
1 , 2


Subskrybcja RSS (wpisy)
RSS - Subskrybuj kanał RSS Pomiędzy bitami
Staty
Related Posts Plugin for WordPress, Blogger...
statystyka
Nawigacja
Blogroll