Kategorie
#Ludzie: Aktualności

Nowa wersja FBC

PIONIER News, 04.2025, #042

Przypomnijmy, że Federacja Bibliotek Cyfrowych, która powstała w Poznańskim Centrum Superkomputerowo-Sieciowym w 2007 roku, jest zbiorem zaawansowanych usług sieciowych, opartych na zasobach cyfrowych dostępnych w polskich bibliotekach cyfrowych i repozytoriach uruchomionych w sieci PIONIER.

FBC nadal pozostaje krajowym agregatorem metadanych o obiektach cyfrowych i akredytowanym agregatorem Europeany, z którą współpraca trwa od wielu lat i będzie kontynuowana w przyszłości.

Uruchomienie nowego portalu stało się też okazją do kompleksowej weryfikacji danych o obiektach cyfrowych znajdujących się w dotychczasowym serwisie. Większość danych prezentowanych w nowej wersji pochodzi z tych samych wiarygodnych źródeł co wcześniej. Jednocześnie cały zasób został gruntownie przeanalizowany i odświeżony, co wiązało się z usunięciem obiektów pochodzących z nieistniejących źródeł oraz dodaniem nowych. Ostatecznie w nowej odsłonie serwisu znalazło się mniej obiektów cyfrowych niż wcześniej jednak są one bardziej aktualne.

– Agregacja danych odbywa się z wykorzystaniem protokołu OAI-PMH w naszym autorskim systemie do agregacji o nazwie DACE – wyjaśnia Marcin Heliński z Działu Bibliotek Cyfrowych i Platform Wiedzy Poznańskiego Centrum Superkomputerowo-Sieciowego. – Pobrane dane przechodzą wiele etapów przetwarzania, a jedną z nowości jest ekstrakcja tekstu lub wykonanie OCR (Optical Character Recognition) dla obiektów z domeny publicznej. Tekst trafia dalej, wraz z metadanymi, do silnika wyszukiwawczego i udostępniany jest do wyszukiwania pełnotekstowego w nowym FBC.

Całkowitą nowością jest możliwość rozpoznawania zapisów nutowych w niektórych obiektach cyfrowych. Wykorzystana została tu technologia OMR (Optical Music Recognition) oparta na specjalnie wytrenowanych głębokich sieciach neuronowych, przeznaczonych do rozpoznawania nut w plikach graficznych. Wykryte dane muzyczne konwertowane są do formatu MEI v.4 (Music Encoding Initiative), a następnie trasformowane są do postaci możliwej do zaindeksowania w silniku wyszukiwawczym FBC w trzech formach składających się z konturu chromatycznego melodii, zapisu pośredniego oraz formatu docelowego, który prezentowany jest użytkownikowi. Oprócz wyszukiwania samej melodii wprowadzonej przez użytkownika, mechanizm analizuje i prezentuje jej najbliższe sąsiedztwo, dzięki czemu prezentowany kontekst melodii jest szerszy i pełniejszy.

Obiekty zawierające zapisy nutowe można wyszukiwać za pomocą wirtualnego pianina, dostępnego w FBC w osobnej zakładce. Wyszukiwanie polega na odegraniu poszukiwanej melodii na pianinie, co wyzwala proces wyszukiwania i w rezultacie wyświetlone zostają obiekty cyfrowe zawierające szukany kontekst muzyczny.

Nowe FBC wyposażone zostało również we własny interfejs OAI-PMH, który pozwala klientom, takim jak Europeana, pobierać informacje o zgromadzonych tu obiektach cyfrowych. Dodatkowo, strona główna FBC umożliwia szybkie przejście do poszczególnych rodzajów obiektów, zgodnie z podziałem na obrazy, teksty, muzykalia, wideo, 3D i Inne (czyli takie, których nie udało się jednoznacznie sklasyfikować).

Pobierz PDF

Magdalena Baranowska-Szczepańska