Artykuł

lip 17 2009
0

Tworzenie kanałów RSS

Zapewne wielu z was słyszało o RSS, systemie który pozwala na czytanie wyselekcjonowanych tematycznie wiadomości. Ale czym tak właściwie jest RSS? Nazwa RSS pochodzi od skrótu Really Simple Syndication, co w tłumaczeniu oznacza mniej więcej naprawdę prosta dystrybucja informacji (skrót RSS posiada jeszcze kilka innych rozwinięć, ale to przytoczone powyżej jest najpopularniejsze). I tak właściwie jest w rzeczywistości. Kanały RSS to z reguły specjalnie spreparowane pliki XML, pozwalające pobierać użytkownikom najnowsze wiadomości umieszczone na różnorakich portalach i serwisach. Wiadomości możemy odczytywać przy pomocy czytników RSS, są to zarówno aplikacje okienkowe pod konkretny system operacyjny (np. Feed Daemon dla Windows), czy też aplikacje webowe (np. Google Reader, startowy.com itp.). Czytniki RSS pozwalają na wykonywanie różnorakich operacji na kanałach RSS. Np. możemy sortować wiadomości wg kategorii, wyszukiwać treść itd. W dzisiejszym artykule zapoznamy się z podstawowymi rodzajami kanałów RSS oraz zobaczmy jak utworzyć kanał w najpopularniejszym ze standardów czyli RSS 2.0.

Formaty RSS

RSS 0.91

RSS 0.91 to wersja najprostsza. Kanał możemy utworzyć w szybki i prosty sposób. Niestety wyżej wymieniona wersja posiada wiele ograniczeń składniowych. Standard ten jest już raczej przestarzały i nie zalecany.

RSS 1.0

Wersja 1.0 jest pewnym odgałęzieniem w historii wersji RSS. W znacznym stopniu różni się od wersji 0.91 i wersji 2.0 (opis poniżej), ponieważ została oparta o język RDF. Podobnie jak wersja 0.91, cechuje się niską popularnością wśród użytkowników.

RSS 2.0

Jest to obecnie najpopularniejsza wersja RSS. Cechuje się dużą liczbą wbudowanych tagów XML oraz możliwością tworzenia własnych. Należy jednak zwrócić uwagę, że własne tagi mogą być błędnie interpretowane przez czytniki XML.

Atom

Jest to standard, który sukcesywnie zyskuje kolejnych zwolenników. Jego założeniem jest uporządkować chaos związany z różnymi wersjami RSS, poprawić czytelność plików XML, które w tej wersji są oparte o RDF.

Tworzenie własnego kanału RSS

Jeśli tworzymy jakiś serwis, czy to blog, portal czy wortal, prędzej czy później zapragniemy dodać do niego kanał RSS aby ułatwić naszym użytkownikom czytanie informacji umieszczonych w serwisie (Jak być może część z Was zauważyła, taki kanał pojawił się również w ostatnim czasie na mojej stronie). Kanał RSS, możemy tworzyć w sposób ręczny (metoda nieelastyczna, szczególnie przy dużych serwisach), lub generować automatycznie za pomocą skryptów/strony WWW. Ponieważ najpopularniejszym formatem jest wciąż RSS 2.0 to na nim oprzemy przykład tworzenia kanału RSS.

Struktura przykładowego kanału RSS 2.0

<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
	<channel>
		<link>/</link>
		<description>Artykuły z zakresu programowania, wymiany plików P2P, logiki matematycznej, sieci komputerowych, porady do popularnych aplikacji i systemów operacyjnych, </description>
		<language>pl</language>
		<copyright>Jerzy Piechowiak, 2006-2009</copyright>
		<pubDate>Wed, 06 May 2009 00:00:01 +0200</pubDate>
		<lastBuildDate>Sat, 28 Nov 2009 20:08:07 +0100</lastBuildDate>
		<title>Alt Control Delete - blog IT</title>
		<item>
			<title>JDownloader - sprawne pobieranie plików z RapidShare i innych</title>
			<link>/artykuly/jdownloader-opis-programu/</link>
			<description>krótki opis wiadomości...</description>
			<pubDate>2009-06-28</pubDate>
		</item>
	</channel>
</rss>

Analiza przykładowego kanału RSS 2.0

Przeanalizujmy powyższy listing linijka po linijce.

  1. Nagłówek dokumentu, standardowa deklaracja XML. Warto zwrócić uwagę na kodowanie pliku
  2. Korzeń dokumentu (root, główny element)
  3. Tag otwierający dane kanału
  4. Link do strony opisywanej w kanale
  5. Opis kanału
  6. Język
  7. Informacje o autorze
  8. Data utworzenia kanału. Zaleca się by była to data podana w standardzie UTC, aczkolwiek może to być data w dowolnej postaci (istnieje wtedy ryzyko błędnej interpretacji takiej daty przez niektóre czytniki)
  9. Data ostatniej aktualizacji kanału. Zaleca się by była to data podana w standardzie UTC, aczkolwiek może to być data w dowolnej postaci (istnieje wtedy ryzyko błędnej interpretacji takiej daty przez niektóre czytniki)
  10. Tytuł kanału
  11. Tag otwierający informacje dotyczące konkretnej wiadomości. Kanał może zawierać dowolną ilość tagów item, jednak z reguły ogranicza się tę ilość do kilkudziesięciu najnowszych (wszystko zależy od częstości publikacji artykułów w serwisie)
  12. Link do artykułu
  13. Krótki opis artykułu, często jest to część wstępna artykułu
  14. Data publikacji artykułu. Zaleca się by była to data podana w standardzie UTC, aczkolwiek może to być data w dowolnej postaci (istnieje wtedy ryzyko błędnej interpretacji takiej daty przez niektóre czytniki)

W kolejnych wierszach zostały przedstawione kolejne znaczniki zamykające, których interpretacja myślę, że jest dla wszystkich zrozumiała. Oczywiście nie są to wszystkie elementy, które mogą trafić do kanału tworzonego w standardzie RSS 2.0, lecz są to niewątpliwie elementy kluczowe, które pozwolą na sprawne tworzenie treściwych kanałów RSS.

Podłączenie kanału RSS do strony WWW

Ostatnim krokiem, który należy uczynić przy tworzeniu kanału RSS, jest jego podłączenie do strony WWW. Możemy to uczynić na dwa sposoby:

  • Poprzez utworzenie linku do pliku z kanałem (zazwyczaj rss.xml) na stronie WWW
  • Poprzez dodanie informacji o kanale do tagów head na naszej stronie

Często na wielu stronach stosowane są oba rozwiązanie, aczkolwiek drugie z wyżej przytoczonych jest szczególnie polecane ponieważ umożliwia szybkie skanowanie robotom i czytnikom XML. Dlatego poniżej przedstawię kod jaki trzeba umieścić w sekcji head naszej strony:

<link rel='alternate' type='application/rss+xml' title='RSS 2.0' href='rss.xml' />

Jak widać nie jest to skomplikowany zapis. Najważniejsze informacje to typ danych application/rss+xml oraz atrybut href, przechowujący nazwę/ścieżkę do pliku kanału RSS. Jeśli plik kanału znajduje się w tym samym katalogu co pliki strony, można podać samą nazwę tego pliku. Czasami jednak bezpieczniej jest użyć pełnej ścieżki, np. /rss.xml, aby uzyskać pewność, że wprowadzony link na pewno będzie prawidłowy.

Data ostatniej modyfikacji: 27.03.2012, 09:16.

Komentarze

blog comments powered by Disqus