Indeksowanie jako sposób jego wdrożenia w skrócie. Przykłady indeksowania dokumentów w bazie szczegółowej i biograficznej


Indeksowanie to proces wyrażania treści dokumentu i
(lub) żądanie w języku wyszukiwania informacji (IRL).
terminy indeksujące – indeksy klasyfikacyjne, przedmiot
nagłówki (PR), słowa kluczowe, deskryptory, kody. Innymi słowy,
indeksowanie to proces tłumaczenia treści dokumentów i zapytań z
języka naturalnego w języku obcym, co skutkuje powstaniem obrazu wyszukiwania
dokument (POD) i obraz zapytania wyszukiwania (POZ). Zatem,
informacje zawarte w dokumencie są „zwinięte” oraz
jego prezentacja w FPJ w formie indeksu, tytułu tematycznego lub
deskryptor, słowo kluczowe

Język wyszukiwania informacji (IRL) jest specjalnie stworzony
sztuczny język przeznaczony do wyrażania treści
dokumentów i (lub) wniosków w celu ich późniejszego przeszukania. IPA jest
główny element aparatu logiczno-semantycznego systemu wyszukiwania informacji (IRS)
Podstawowe wymagania dla IPYA:
· Jednoznaczność;
· Wystarczająca moc semantyczna
· Otwartość (możliwość dostosowania językowego)

Każdy IPL ma określone słownictwo, które reprezentuje
zbiór jednostek leksykalnych (LU) – oznaczenia jednostki
pojęcie, minimalne i niepodzielne w tej funkcji. Jak LE w
W IPL posługujemy się słownictwem języków naturalnych – słowami, zwrotami
nagłówek tematu, kody numeryczne lub alfanumeryczne itp.
Ważnym punktem podczas indeksowania jest stworzenie wyszukiwarki
obrazy dokumentów (DOI) Wyszukaj obraz dokumentu – main
zawartość semantyczną dokumentu (a nie wszystkie informacje w nim zawarte).
niemiecki), wyrażony w formie sformalizowanego IPL. POD jest umieszczony w
jednoznaczne przestrzeganie tego dokumentu, do czego jest przyzwyczajony
wyszukiwanie dokumentów w szeregu dokumentów.

Indeksowanie żądania odbywa się również poprzez jego tłumaczenie
treści na IPYA. Zatem zestaw terminów
indeksowanie, wyrażające treść semantyczną zapytania, nazywa się
wyszukany obraz zapytania (POI).
Wyszukiwanie odbywa się za pomocą zestawu terminów indeksujących. Z celem
może zwiększyć efektywność wyszukiwania informacji na żądanie POS
uzupełnione specjalnymi instrukcjami dotyczącymi kolejności wykonywania
operacje logiczne w procesie wyszukiwania informacji, które
nazywane są instrukcjami wyszukiwania.

Indeksowanie realizowane jest w następujących procesach: subiektywizacji,
systematyzacja i indeksowanie współrzędnych.
Systematyzacja to rodzaj indeksowania treści dokumentu
i (lub) żądanie jest wyrażone za pomocą wskaźników klasyfikacyjnych, zgodnie z
zasady określonej klasyfikacji IP (KS). Ta zasada
indeksowanie uważa się za klasyfikację. Zapewnia
umiejętność organizowania wyszukiwania informacji w sposób hierarchiczny
podpisać. Specjaliści przeprowadzający proces systematyzacji w
biblioteki i centra informacyjne nazywane są systematyzatorami

Subiektywizacja to rodzaj indeksowania, w którym treść dokumentu i (lub)
żądanie wyrażane jest poprzez nagłówek tematyczny (SR) zgodnie z określonymi zasadami
IPL tematyczny. Zasada indeksowania tematycznego opiera się na
używając LE, które są częścią nagłówków tematów, języka naturalnego (tj.
Nagłówki tematyczne wyrażające POD i POP są zestawiane na podstawie naturalnych
język). Umożliwia to zasada indeksowania tematycznego
organizowanie wyszukiwania informacji w kolejności alfabetycznej. Procesy
identyfikacja przedmiotowa prowadzona jest w bibliotekach i centrach informacji
obiektywiści.
Indeksowanie współrzędnych to rodzaj indeksowania, w którym semantyczne
treść dokumentu i (lub) żądania wyrażana jest wielowymiarowo za pomocą wielu kluczy
słowa lub deskryptory. IPY przeznaczony do indeksowania współrzędnych,
zwany językiem deskryptorów. Specjaliści, którzy przeprowadzają skoordynowane
indeksowanie nazywane są indeksatorami.

.
Tak więc, w zależności od rodzaju indeksowania, istnieją
tematyczny, klasyfikacja i deskryptor IPL. W ich
kompozycja zawiera wiele LE i gramatycznych (paradygmatycznych i
syntagmatyczne) relacje między nimi. LE – oznaczenie odrębne
pojęcia przyjęte w IPL i niepodzielne w tej funkcji. LE może
reprezentują słowa przyjęte w języku naturalnym, stabilne
zwroty, skróty, symbole, daty, popularne skróty,
leksykalnie istotne składniki słów złożonych i ich odpowiedniki
kod lub symboliczne oznaczenia sztucznego języka.
Relacje gramatyczne pozwalają zorganizować LE w system.

Wymagania dotyczące adresu IP:
· Całkowicie i dokładnie przekazać treść dokumentu odzwierciedloną w niniejszym IRS;
· Zapewnienie jednoznacznej interpretacji terminów indeksowanych;
· Zezwalaj na indeksowanie wieloaspektowe;
· Zezwalaj na zmiany (dodatki, poprawki);
· Zapewnij prostotę i wygodę indeksowania, wyszukiwania informacji i
utrzymanie tego IPS;
· Odzwierciedlić aktualny stan systemu terminologicznego w tej dziedzinie wiedzy.

10.

Konieczność stworzenia sztucznego języka (np
wyrażenia treści semantycznej
dokumentów w celu ich przeszukania) wynika z faktu, że
język naturalny ma wiele właściwości,
uniemożliwiające jego wykorzystanie do nagrywania i wyszukiwania
informacja: jest to dwuznaczność i polisemia słów
język naturalny. Dokładne znaczenie wielu słów może być
określane jedynie na podstawie kontekstu, w jakim one występują
używany (instrument perkusyjny, dawka uderzenia itp.).
Czynniki te utrudniają osiągnięcie dokładnego dopasowania
pomiędzy treścią dokumentu a środkami wyrazu
tę treść.
Trudności w posługiwaniu się językiem naturalnym jako
IPA są również wzmocnione przez fakt, że w IPA jako wkład
można używać dokumentów, ale nie pełnych tekstów
streszczenia, adnotacje, opisy bibliograficzne,
które są wynikiem zwijania się treści
dokumenty.

Wszystkie dokumenty prezentowane w katalogu nie stanowią ich oficjalnej publikacji i służą wyłącznie celom informacyjnym. Elektroniczne kopie tych dokumentów mogą być rozpowszechniane bez ograniczeń. Informacje z tej witryny możesz publikować w dowolnej innej witrynie.

SYSTEM STANDARDÓW INFORMACJI, BIBLIOTEKI I WYDAWNICTWA

INDEKSOWANIE DOKUMENTÓW

OGÓLNE WYMAGANIA DOTYCZĄCE INDEKSOWANIA WSPÓŁRZĘDNYCH

GOST 7,66-92
(ISO 5963-85)

GOSSTANDARD ROSJI

Moskwa

STANDARD PAŃSTWOWY ZWIĄZKU ZSRR

Data wprowadzenia 01.01.93

Norma ta ustanawia ogólne wymagania dotyczące indeksowania współrzędnych dokumentów, w tym zasady generowania obrazu wyszukiwania dokumentu. Szczegółowe wymagania dotyczące systematyzacji i identyfikacji przedmiotowej dokumentów są zgodne z GOST 7.59. Formularz prezentacji obrazu wyszukiwania dokumentu w formacie komunikacyjnym MEKOF jest zgodny z GOST 7.52.

Norma dotyczy systemów wyszukiwania informacji, w których treść dokumentów jest prezentowana w formie skompresowanej za pomocą jednostek leksykalnych języka wyszukiwania informacji. Norma nie ma zastosowania do generowania zapisów faktycznych w bazach faktograficznych.

Terminy i definicje - zgodnie z GOST 7.0, GOST 7.26, GOST 7.27, GOST 7.59 i nia 1.

Dodatkowe wymagania, odzwierciedlające potrzeby gospodarki narodowej, podano w NI 1.

1. POSTANOWIENIA OGÓLNE

1.1. Proces indeksowania składa się z następujących etapów, które są realizowane w następującej kolejności:

analiza i określenie treści dokumentu jako przedmiotu indeksowania;

wybór koncepcji charakteryzujących treść dokumentu;

wybór terminów indeksujących do oznaczania pojęć;

tworzenie obrazu wyszukiwania dokumentu na podstawie terminów indeksowanych.

Wymienione etapy można łączyć w ramach procedur technologicznych pod warunkiem prawidłowego wykonania każdego etapu.

1.2. Obraz wyszukiwania dokumentu (SID) tworzony jest z wybranych terminów indeksowanych przy użyciu środków gramatycznych języka wyszukiwania informacji (IRL).

1.3. W procesie indeksowania nie zaleca się opisywania dokumentu jako obiektu fizycznego (pod względem kształtu, objętości itp.). Dopuszczalne jest uwzględnienie takich informacji w PML, jeśli pozwala to na dokładniejsze ustalenie zgodności dokumentu z potrzebami informacyjnymi użytkownika systemu.

2. ANALIZA DOKUMENTÓW

2.1. Analizując dokument, osoba indeksująca musi mieć możliwość przejrzenia dokumentu w całości. Jeżeli dokładne zapoznanie się z dokumentem nie jest możliwe, indeksator musi zapoznać się z dostępnymi fragmentami tekstowymi dokumentu (głównymi źródłami indeksowania):

aparat odniesienia dokumentu - tytuł (nazwa), adnotacja, streszczenie, treść (spis treści), przedmowa, zakończenie itp.;

wstęp;

tytuły części i rozdziałów;

pierwsze frazy rozdziałów i akapitów;

ilustracje, diagramy, tabele i podpisy;

słowa i grupy słów podkreślone lub wyróżnione w tekście za pomocą środków drukarskich.

Indeksowanie wyłącznie według tytułu jest niekompletne. Indeksując abstrakty i adnotacje należy zadbać o to, aby treść dokumentu była w nich odpowiednio oddana.

2.2. Analizując dokumenty nietekstowe (audiowizualne i inne), które oprócz czytania wymagają obejrzenia, odsłuchania, sprawdzenia obiektu w działaniu i innych podobnych procedur, dopuszcza się ich indeksowanie według istniejącego komponentu tekstowego (nazwa, krótki opis, itp.), ale nawet w tym przypadku osoba indeksująca powinna mieć możliwość pełnego przejrzenia dokumentu, jeżeli materiał tekstowy wydaje się niewystarczający.

3. WYBÓR POJĘĆ CHARAKTERYZUJĄCYCH TREŚĆ DOKUMENTU

3.1. Liczba cech i pojęć odzwierciedlonych w PML stanowi o jego kompletności i jest najważniejszym wskaźnikiem jakości indeksowania.

3.1.1. PML musi odzwierciedlać wszystkie koncepcje, które mogą być wartościowe dla użytkowników systemu.

Dokument może identyfikować więcej niż jeden temat z obszaru zainteresowań użytkownika. Tematy te należy rozpatrywać osobno.

3.1.2. Tematyka poruszana podczas indeksowania nie powinna ograniczać się do wąskich ram bezpośrednich interesów użytkowników systemów wyszukiwania informacji. Pojęcia związane z drugorzędnymi aspektami dokumentu (na przykład społecznymi i ekonomicznymi aspektami badań naukowo-technicznych) powinny również zostać uwzględnione w AML.

3.1.3. Przy wyborze koncepcji głównym kryterium jest potencjalna wartość koncepcji dla wyrażenia treści dokumentu lub jego przeszukiwania. W takim przypadku należy skupić się na typowych żądaniach kierowanych do IPS:

wybrać koncepcje najczęściej używane w społeczności użytkowników IPS;

wyjaśniać słownictwo i zasady gramatyczne języka obcego w oparciu o opinie użytkowników.

Zmiany wprowadzone w IPL nie powinny naruszać ogólnej struktury i logiki towarzyszącej jego tworzeniu.

3.1.4. O liczbie terminów indeksowanych przypisanych do jednego dokumentu decyduje ilość informacji zawartych w dokumencie. Ograniczanie liczby terminów powinno opierać się na sensownym wyborze najważniejszych pojęć.

3.2. O kompletności indeksowania przyjętego w każdym systemie informatycznym decyduje jego cel funkcjonalny. Rozmiar dokumentu również znacząco wpływa na kompletność indeksowania. Należy wziąć pod uwagę te czynniki i na ich podstawie dokonać fachowego wyboru koncepcji z dokumentu, nie próbując włączać do AML wszystkich wymienionych w nim koncepcji.

3.3. Specyfika AML zależy od tego, w jakim stopniu koncepcje dokumentu są trafnie odzwierciedlone w terminach indeksowanych, a także jest jednym z parametrów jakości indeksowania. Zastąpienie pojęcia terminem odzwierciedlającym szersze pojęcie prowadzi do utraty specyficzności. W szczególnych przypadkach można zastosować szersze terminy:

jeśli zbyt szczegółowe określenie nie jest jasne dla użytkowników, zwłaszcza gdy odpowiadające mu pojęcie jest używane tylko w granicznych obszarach działalności;

jeżeli koncepcja nie jest w pełni ujawniona w dokumencie lub ma charakter pomocniczy dla przedstawienia treści dokumentu.

3.4. Zaleca się, aby każdy IPS opracował listy cech, które uważa się za ważne do odzwierciedlenia w AML. Dla wszystkich systemów można zalecić listę wskaźników roli zgodnie z GOST 7.52. W zależności od potrzeb konkretnego adresu IP lista ta może zostać rozszerzona lub skrócona.

4. WYBÓR TERMINÓW INDEKSOWANIA

4.1. W procesie doboru terminów indeksacyjnych pojęciami charakteryzującymi treść dokumentu są:

preferowane jednostki leksykalne (deskryptory lub słowa kluczowe), wybrane zgodnie z zasadami danego języka angielskiego;

terminy odzwierciedlające nowe koncepcje, sprawdzając ich dokładność i akceptowalność w słownikach, encyklopediach, podręcznikach, tabelach klasyfikacyjnych, tezaurusach wyszukiwania informacji, standardach terminologicznych i innych źródłach uznawanych za wiarygodne w tej dziedzinie.

4.2. Wybór terminów indeksowania odbywa się na podstawie zarejestrowanego (GOST 7.25) lub opublikowanego tezaurusu wyszukiwania informacji, który jest używany podczas tworzenia zapytań do systemu wyszukiwania informacji.

Korzystając ze słownika tezaurusów, istnieje możliwość ograniczenia liczby terminów zawartych w PML poprzez wyłączenie pojęć ogólnych, z których można skorzystać na etapie wyszukiwania dokumentu lub na etapie sporządzania instrukcji wyszukiwania na podstawie linków w artykułach tezaurusów .

4.3. Pojęcia, które nie są reprezentowane w słowniku indeksującym, ale są niezbędne do utworzenia PML, wyrażane są na jeden z dwóch sposobów:

nowy specyficzny termin zawarty w AML i słowniku;

bardziej ogólny termin występujący w IPL; w tym przypadku konkretny termin jest wysyłany do serwisu technicznego FL jako kandydat do umieszczenia w słowniku.

Nowe pojęcia są reprezentowane jako najbliższe jednostki leksykalne istniejące w języku angielskim, oceniana jest także użyteczność włączania nowych terminów do słownika z punktu widzenia wyszukiwania.

4.4. Podczas indeksowania za pomocą bezpłatnych słów kluczowych zaczerpniętych z tekstu dokumentu należy je sprowadzić do postaci kanonicznej zgodnie z GOST 7.25. Zaleca się ograniczenie długości fraz do dwóch lub trzech form wyrazowych.

Schemat indeksowania wykorzystujący tezaurus wyszukiwania informacji podano w nii 2.

5. TWORZENIE OBRAZU WYSZUKIWANIA DOKUMENTU

5.1. POD składa się z wybranych terminów indeksujących, zorganizowanych przy użyciu środków gramatycznych FL danego IRS.

5.2. Następujące kategorie danych przewidzianych przez technologię indeksowania konkretnego IRS mogą zostać uwzględnione w AML:

stopień normalizacji terminów indeksowanych i stosowane w tym celu słownictwo;

indywidualna charakterystyka terminu indeksowanego;

połączenie terminów indeksujących w konstrukcjach syntaktycznych POD.

Aby uwzględnić dane faktyczne w PML, kategorie gramatyczne określone w. 6 .

5.3. Ze względu na stopień normalizacji wyróżnia się dwa typy terminów indeksujących współrzędne: deskryptory i słowa kluczowe.

5.4. Terminy indeksowane muszą być prezentowane w AML zgodnie z zasadami pisowni języka naturalnego używanego w systemie.

5.4.1. Deskryptory mogą być reprezentowane przez kody warunkowe określone w używanym słowniku indeksowania. W takim przypadku IRS musi zapewnić automatyczne wyszukiwanie form pisowni deskryptorów według ich kodów.

5.4.2. Słowa kluczowe w wielojęzycznych systemach informacyjnych, w których AML opiera się na różnych językach narodowych, muszą być oznaczone znakami wskazującymi, że należą one do tego czy innego języka naturalnego.

5.5. Indywidualne cechy terminów indeksujących są opcjonalnymi elementami AML i służą do doprecyzowania treści dokumentu, uporządkowania procedur wyszukiwania informacji lub dalszego analitycznego i syntetycznego przetwarzania dokumentów w systemie.

Indywidualna charakterystyka obejmuje dane dotyczące kategorii semantycznej i morfologicznej terminu indeksującego, jego roli i wagi informacyjnej, sposobu uzyskania i przeznaczenia.

5.5.1. Cechą semantyczną terminu indeksującego jest zaklasyfikowanie go do następujących kategorii leksykograficznych:

1) określenie wyrażające koncepcję naukowo-techniczną;

2) nazwę własną, identyfikator;

3) nazwa parametru;

4) wartość parametru (wyrażona tekstem lub nazwaną wartością);

5) wyrażenie liczbowe;

6) oznaczenie jednostki wartości.

5.5.2. Cechą morfologiczną terminu indeksującego jest przypisanie go do kategorii leksykograficznych:

1) słowo pochodne;

2) słowo złożone;

3) fraza;

4) skrót;

5) fragment słowa.

Charakterystyki morfologiczne są wykorzystywane w POD do realizacji analizy semantycznej jednostek leksykalnych w IRS w oparciu o ich cechy formalne.

5.5.3. Rola terminu indeksującego jest wskazana w AML w celu wyjaśnienia miejsca odpowiedniego pojęcia w treści dokumentu. W tym celu specjalne wskaźniki roli przyjęte w IRS oznaczają warunki indeksowania, które odzwierciedlają następujące aspekty dokumentu:

1) przedmiot badań, opis;

2) cechy, właściwości, parametry obiektu;

3) metody i narzędzia badawcze, wyposażenie technologiczne;

4) elementy, elementy, szczegóły obiektu;

5) obszar zastosowania przedmiotu (dziedzina gospodarki, technologia, nauka);

6) przeznaczenie przedmiotu;

7) cel badań, rozwój, opis;

8) wyniki prac badawczo-rozwojowych.

5.7. Zapis POD w pamięci IPS zależy od przyjętej w nim metody kodowania, biorąc pod uwagę wymagania tej sekcji i GOST 7.52.

6. INDEKSACJA RZECZOWA DOKUMENTU

6.1. Indeksacja faktyczna dokumentu (FID) polega na zidentyfikowaniu w dokumencie i włączeniu do AML danych wyrażających określone informacje (komunikaty) dostępne w dokumencie.

Na podstawie wyników FID tworzone są tablice informacyjne w systemach informacji faktograficznej, w których jednostką informacji jest zapis faktyczny.

6.2. FID zakłada formalne rozróżnienie w AML pomiędzy dwiema kategoriami terminów indeksujących wyrażających:

1) tematy lub przedmioty wiadomości;

2) właściwości przypisywane tym przedmiotom, stanowiące znaczenie przekazu.

Odpowiednie terminy indeksujące muszą być ze sobą powiązane w strukturę syntaktyczną, która łączy w sobie nazwę obiektu, jego cechy, ich znaczenia, jednostki wartości i odzwierciedlającą powiązania semantyczne pojęć w dokumencie.

Dodatkowo taką konstrukcję syntaktyczną można scharakteryzować:

1) wskaźnik modalności;

2) warunek prawdy.

6.3. Wskaźnik modalności komunikatu merytorycznego określa różnicę pomiędzy komunikatami następujących typów:

1) obserwowalny fakt;

2) wartość dopuszczalna;

3) wymaganie standardowe;

4) wskaźnik celu;

7) założenie;

8) stan.

Jeżeli system informacyjny nie wykorzystuje wskaźników modalności, wówczas wszystkie komunikaty faktyczne uznaje się za należące do jednej modalności, co należy wskazać w dokumentacji operacyjnej systemu.

6.4. Warunkiem prawdziwości przekazu faktograficznego jest inny komunikat faktograficzny powiązany z pierwszym w konstrukcji syntaktycznej wyższego poziomu.

Na przykład:

X = waga produktu

Z = 150 g.

V = wilgotność nie większa niż 45%,

Gdzie X- charakterystyka obiektu,

Z- wartość charakterystyczna,

Y- warunek prawdy.

Przekaz faktyczny, będący warunkiem prawdziwości, musi posiadać wskaźnik modalności warunku” Jeśli", Na przykład:

(waga produktu = 150 g) ( Jeśli(wilgotność nie większa niż 45%).

6,5. Terminy indeksujące wyrażające temat (przedmiot) wiadomości należą do kategorii 1 lub 2 określonych w 5.5.1. W przypadku stosowania kategorii 1 członowi indeksującemu można dodatkowo przypisać wskaźnik osobliwości lub ogólności obiektu (kwantyfikator).

Ogólny kwantyfikator jest używany w komunikatach, w których wyrażane jest stwierdzenie dotyczące wszystkich obiektów wchodzących w zakres odpowiedniego pojęcia.

Kwantyfikator osobliwości stosowany jest w komunikatach wyrażających informację o przedmiocie będącym częścią danego pojęcia, o którym mowa w tym dokumencie.

6.6. Terminy indeksujące wyrażające właściwości obiektów składających się na znaczenie przekazu można wyrazić jednostkami leksykalnymi kategorii 1, 2, 3 ( m. 5.5.1) lub projektowanie parametryczne ( ).

6.7. Konstrukcja parametryczna musi składać się z dwóch formalnie wyrażonych części: nazwy parametru i listy wartości parametrów (patrz), które są połączone w jedną konstrukcję syntaktyczną.

14. Koniec

Na rysunku przedstawiono schemat blokowy indeksowania według tezaurusu wyszukiwania informacji.

Schemat blokowy algorytmu indeksowania

DANE INFORMACYJNE

1. OPRACOWANE I WPROWADZONE przez Państwowy Komitet Nauki i Technologii ZSRR oraz Komitet Techniczny TC 191 „Informacja naukowa i techniczna, biblioteka i publikacje”

DEWELOPERS

VI.I. Biełoozow,Doktorat Filol. Nauki ścisłe (lider tematu); N.D. Krawczenko, Doktorat pe. nauki; I.V. Trostnikowa; nie dotyczy Śliwnicyna; G.N. Khondkarian; V.N. Kazakow, Doktorat technologia nauki

2. ZATWIERDZONE I WEJŚCIE W ŻYCIE Uchwałą Komitetu Normalizacyjnego i Metrologii ZSRR z dnia 27 marca 1992 r. nr 297

Norma ta została opracowana poprzez bezpośrednie zastosowanie dokumentacji ISO 5963-85. Metody analizy dokumentów, ustalania ich przedmiotu i wyboru terminów indeksowania” z dodatkowymi wymaganiami odzwierciedlającymi potrzeby gospodarki narodowej

3. Data pierwszego przeglądu to rok 1995.

Częstotliwość przeglądów - 5 lat

4. OPRACOWANE PO PIERWSZYM RAZIE

5. DOKUMENTY REGULACYJNE I TECHNICZNE

Numer pozycji, zastosowanie

Część wprowadzająca

GOST 7,25-80

GOST 7,26-80

Część wprowadzająca

GOST 7,27-80

Część wprowadzająca; Załącznik 1

GOST 7,52-85

Część wprowadzająca; 5.7

Część wprowadzająca; Załącznik 1

Indeksowanie dokumentu zwykle organizowane poprzez automatyczne przetwarzanie tekstu i uzupełnianie metadanych. Automatyczne przetwarzanie– indeksowanie pełnotekstowe – polega na zamianie tekstu dokumentu na zbiór słów. Ponadto, zazwyczaj dla słów zapisana jest ich pozycja w dokumencie, co umożliwia wyszukiwanie po frazach. Istnieją dwie zasadniczo różne metody takiego indeksowania, biorąc pod uwagę metody wyszukiwania stosowane w przyszłości:

    indeksowanie binarne– nie zależy od języka dokumentu ze względu na indeksowanie binarne lub słownikowe;

    indeksowanie morfologiczne– przeprowadza się z uwzględnieniem morfologii i semantyki języka.

Na indeksowanie binarne(niezależne od kontekstu według klasyfikacji) wyszukiwanie odbywa się w oparciu o algorytmy „wyszukiwania rozmytego”, tj. szukaj z błędami. W takim przypadku dopuszczalne jest niepełne (z określoną liczbą błędów na początku, w środku i na końcu wyrazu) dopasowanie wyrazów do szablonu. Druga metoda indeksowania (kontekstowa zgodnie z klasyfikacją) polega na konwersji wyrazów na formy wyrazowe z obciętymi końcówkami i końcówkami, co umożliwia wyszukiwanie odmian i koniugacji wzorców.

Standardowo włączone metadane obecnie nie istnieje, ale zazwyczaj zawierają co najmniej datę powstania dokumentu, jego wielkość, ewentualnie rodzaj i autora, streszczenie – streszczenie i słowa kluczowe. Warto zaznaczyć, że ostatnie pola (streszczenie i słowa kluczowe) są obecnie wypełniane ręcznie. Jednocześnie, jeśli format dokumentu je przewiduje i autor je wypełnił, wszystko jest w porządku, ale prawie zawsze nie ma ich w prawdziwych dokumentach. Dlatego istniejące obecnie systemy zarządzania dokumentami zazwyczaj je ignorują ze względu na ich niezwykle kosztowne i powolne uzupełnianie przez operatora wprowadzającego dokumenty do systemu.

Pomimo niewątpliwych zalet indeksowanie pełnotekstowe w dowolnej formie ma szereg istotnych zalet wady:

    duża ilość „śmieci” w indeksie, tj. słowa, które w żaden sposób nie charakteryzują dokumentu, ale łączą słowa „kluczowe” - co oznacza możliwą dużą liczbę nieistotnych dokumentów podczas wyszukiwania, jeśli szablon wyląduje w „śmieciach”;

    duży wolumen indeksu ze względu na „śmieci” - a zatem zużycie zasobów na ich przechowywanie i czas na ich przeszukiwanie.

Te wady determinuje sama koncepcja takiego indeksowania – z zachowaniem całego tekstu z wyjątkiem „słów końcowych”. Rzeczywiście, z jednej strony obecność w indeksie wszystkich słów tekstu gwarantuje, że zostanie on odnaleziony według któregokolwiek z nich, ale z drugiej strony pojawia się pytanie: „Na ile to jest poprawne?” Załóżmy, że mamy tekst o technologii komputerowej, który zawiera przysłowie: „Jeśli gonisz dwie zające, nie złapiesz żadnej”. Gdy wyszukasz słowo „zając”, system zwróci ten dokument, chociaż nie będzie on miał najmniejszego związku z fauną. Wyraźnie ilustrują to słowa „przyimek”, „spójnik” i „zaimek” podane tuż powyżej w tym tekście.

W ten sposób możemy to stwierdzić musisz zaindeksować „kluczowe” słowa dokumentu, a nie cały tekst, aby zapewnić wiarygodność wyników wyszukiwania. Jednak w odróżnieniu od systemów dokumentowych pierwszej generacji, które stosowały ręczne indeksowanie, proces ten musi odbywać się w pełni automatycznie ze względu na znacznie zwiększony obieg dokumentów. Istnieją do tego wszystkie warunki wstępne pod względem środków technicznych. Dodatkowo zaindeksowanie słów „kluczowych” znacząco zmniejszy wielkość indeksu, a co za tym idzie i czas jego wyszukiwania.

Indeksacja dokumentów polega na nadaniu im umownych oznaczeń cyfrowych (czasami alfanumerycznych) - indeksów, które nadawane są dokumentom podczas rejestracji i wskazują miejsce sporządzenia, czas wykonania i przechowywania dokumentów. Obowiązkowym elementem indeksu jest seryjny numer rejestracyjny w obiegu dokumentów, który zazwyczaj jest rejestrowany przez rok. Zgodnie z celami poszukiwań numer porządkowy można uzupełnić indeksem według nomenklatury spraw, a także innymi znakami klasyfikacyjnymi (indeksy działów strukturalnych, urzędników, korespondentów, kwestii operacyjnych, rodzajów dokumentów itp.). Składniki indeksu rejestracyjnego oddziela się od siebie ukośnikiem, np.: 356/01,134/02/03-10.

Najczęściej indeks nomenklatury jest dołączany do numeru seryjnego dokumentów rejestracyjnych, ponieważ głównym schematem klasyfikacji dokumentów w pracy biurowej jest nazewnictwo spraw.

Podstawą nomenklatury przypadków indeksacyjnych jest lista lub lista podziałów strukturalnych wraz z przypisanymi im indeksami lub symbolami. Do indeksu jednostki strukturalnej dodawany jest numer sprawy zgodnie z nomenklaturą spraw w obrębie jednostki strukturalnej, np.: 05-15, gdzie 05 to indeks jednostki strukturalnej (zwykle pokrywa się on z numerem seryjnym jednostki strukturalnej) jednostka według tabeli personelu), 15 to numer sprawy zgodnie z nomenklaturą. Celowość numerowania przypadków w ramach jednej jednostki strukturalnej tłumaczy się tym, że w ten sposób osiąga się największą stabilność liczb. Pojawienie się nowych spraw lub zmniejszenie liczby spraw w jednej jednostce strukturalnej, utworzenie lub likwidacja jednostek strukturalnych (a w konsekwencji spraw) nie ma wpływu na indeksację spraw innych jednostek strukturalnych.

Jednym z elementów systemu rejestracji są klasyfikatory, które opracowywane są z uwzględnieniem potrzeb instytucji w zakresie wyszukiwania dokumentów.

Jeżeli nie ma nomenklatury przypadków, przy przypisywaniu indeksu rejestracyjnego stosuje się klasyfikator jednostek strukturalnych, po którym z reguły następuje sekwencja jednostek strukturalnych zgodnie z tabelą personelu. Na przykład: usługa zarządzania biurem - 01; dział planowania i finansów - 02; Dział Marketingu i Reklamy - 03; dział sprzedaży - 04; dział personalny - 05; dział prawny - 06; księgowość - 07; wydział administracyjno-ekonomiczny - 08.

Często instytucje opracowują cyfrowe klasyfikatory urzędników, najczęściej menadżera i jego zastępców, np.: dyrektor generalny – 01; dyrektor finansowy - 02; dyrektor handlowy - 03; Zastępca Dyrektora Generalnego ds. Administracyjnych i Ekonomicznych – 04.

Dzięki takiej strukturze indeksowania, za indeksem rejestracyjnym można ustalić, kto recenzował dokument i do jakiej jednostki strukturalnej został on przesłany do realizacji. Na przykład: 346.02.07, gdzie 346 to numer seryjny pisma przychodzącego, 02 to indeks dyrektora finansowego, 07 to indeks działu księgowości.

Stosowanie indeksów urzędników podczas rejestracji jest wskazane w przypadku tworzenia akt (przede wszystkim korespondencji podpisanej przez kierownictwo) w działach strukturalnych.

Umiejscowienie numeru rejestracyjnego dokumentu w jego indeksie może się różnić w zależności od tego, jaki dokument jest rejestrowany - wkład inicjatywy Lub dzień wolny od inicjatywy. Rejestracja dokumentów wychodzących inicjatywy różni się od rejestracji dokumentów wejściowych inicjatywy tylko pod dwoma względami: elementy indeksu rejestracyjnego są zapisywane w odwrotnej kolejności, a indeks urzędnika jest indeksem osoby, która podpisała dokument.

Tak więc, rejestrując dokument wychodzący inicjatywy, najpierw wprowadza się numer rejestracyjny z grupą dokumentów przychodzących inicjatywy (na przykład 1034), następnie indeks urzędnika - autora uchwały (na przykład 02), a następnie numer indeks jednostki strukturalnej, do której dokument jest wysyłany do realizacji (na przykład 06 ), a po wykonaniu dokumentu - druga część indeksu - indeks sprawy zgodnie z nomenklaturą (na przykład 14). Pełny indeks rejestracyjny będzie wyglądał następująco: 1034/02/06-14.

Rejestrując dokument wychodzący inicjatywy, dokument jest najpierw oznaczony indeksem sprawy zgodnie z nomenklaturą (na przykład 05-12), następnie indeksem urzędnika, który podpisał dokument (na przykład 01) i numerem rejestracyjnym dla grupy dokumentów wychodzących inicjatywy (na przykład 960). W takim przypadku pełny indeks rejestracyjny będzie wyglądał następująco: 05-12/01/960.

Dokumenty administracyjne (rozporządzenia, decyzje, zarządzenia, zarządzenia), a także niektóre dokumenty wewnętrzne (protokoły, akty) posiadają jedynie sygnaturę w ciągu roku (od stycznia do grudnia).

Jedynie w placówkach oświatowych dokumenty wewnętrzne mogą być numerowane według roku akademickiego.

W niektórych przypadkach można zastosować przyrostki literowe.

Przy rejestracji odwołań obywateli do numeru seryjnego dodaje się pierwszą literę nazwiska wnioskodawcy.

Na przykład: D-23. S-12.

Rejestracja dokumentów o ograniczonym dostępie polega na dodaniu odpowiedniego znaku do indeksu ewidencyjnego, np.: 235/01-05DSK.

W celu rozróżnienia grup zleceń według personelu, każdemu typowi można przypisać indeks literowy. System indeksowy opracowywany jest przez służby kadrowe z uwzględnieniem specyfiki rejestracji i tworzenia zleceń w danej instytucji. W przypadku zamówień dotyczących personelu (przyjęcia, przeniesienia, zwolnienia, pracy w niepełnym wymiarze godzin pracowników instytucji, pomocy finansowej, awansu pracowników) liczby są zwykle dodawane z literą „K” (personel) lub „ OS” (personel), na przykład: nr 145-K, nr 68-OS. Jeżeli zamówienia na zachęty są prowadzone osobno, dodaje się literę „C” (zachęty), na przykład: № 47-3. Rozkazy udzielenia urlopu mogą mieć następujący indeks literowy: nr 83-Ot., polecenia podróży - nr 54-B, zlecenia odbioru - Nr 5-S.

W dokumentach, których autorami jest kilka organizacji, indeksy autorów są oznaczone ukośnikiem w kolejności wskazywania autorów (od lewej do prawej). Przykładowo indeks rejestracyjny wspólnego zamówienia trzech instytucji będzie wynosił: 356/501/231.

Jedną z najważniejszych operacji analitycznego i syntetycznego przetwarzania informacji jako środka wyszukiwania informacji jest indeksowanie dokumentów i zapytań informacyjnych.

Indeksowanie – proces wyrażania treści dokumentu i (lub) wniosek NA język wyszukiwania informacji (IRL) używając terminy indeksowania– indeksy klasyfikacyjne, tytuły przedmiotowe (GR), słowa kluczowe, deskryptory, kody . Inaczej mówiąc, indeksowanie to proces tłumaczenia treści dokumentów i zapytań z języka naturalnego na język FL, w wyniku którego powstaje obraz wyszukiwania dokumentów (DOI) i obraz wyszukiwania zapytań (QII). W ten sposób informacje zawarte w dokumencie są „zwijane” i prezentowane w IPL w formie indeksu, nagłówka lub deskryptora tematu lub słowa kluczowego.

Język wyszukiwania informacji (IRL) – Jest to specjalnie stworzony sztuczny język przeznaczony do wyrażania treści dokumentów i (lub) zapytań w celu ich późniejszego wyszukiwania. ILP jest głównym elementem aparatu logiczno-semantycznego systemu wyszukiwania informacji (IRS).

Konieczność tworzenia języka sztucznego (w celu wyrażenia treści semantycznej dokumentów w celu ich przeszukiwania) wynika z faktu, że język naturalny posiada szereg właściwości, które uniemożliwiają jego wykorzystanie do rejestrowania i wyszukiwania informacji: jest to niejednoznaczność i polisemia słów w języku naturalnym. Dokładne znaczenie wielu słów można określić jedynie na podstawie kontekstu, w jakim są użyte (instrument perkusyjny, dawka uderzenia itp.). Czynniki te nie pozwalają na osiągnięcie dokładnej zgodności pomiędzy treścią dokumentu a sposobami wyrażenia tej treści.

Trudności w posługiwaniu się językiem naturalnym jako językiem obcym dodatkowo pogłębia fakt, że w systemie informacyjnym jako dokumenty wejściowe mogą być wykorzystywane nie pełne teksty, lecz streszczenia, adnotacje i opisy bibliograficzne, które powstają w wyniku zwinięcia treści dokumentów.

Podstawowe wymagania dla IPYA:

· Jednoznaczność;

· Wystarczająca moc semantyczna

· Otwartość (możliwość dostosowania językowego)

Każdy IPL ma specyficzne słownictwo, które reprezentuje zestaw jednostki leksykalne (LE)– oznaczenie odrębnego pojęcia, minimalnego i niepodzielnego w tej funkcji. W IPL jako LE stosuje się słownictwo języków naturalnych - słowa, wyrażenia z tytułu tematu, kody cyfrowe lub alfanumeryczne itp.

Ważnym punktem podczas indeksowania jest utworzenie obrazu wyszukiwania dokumentów (SID). Wyszukaj obraz dokumentu– główna treść semantyczna dokumentu (a nie wszystkie informacje w nim zawarte), wyrażona w formie sformalizowanego IPL. PML jest jednoznacznie dopasowywany do tego dokumentu, a dokumenty są wyszukiwane w tablicy dokumentów.


Indeksowanie zapytania odbywa się również poprzez przetłumaczenie jego treści na FP. W ten sposób nazywany jest zbiór terminów indeksujących wyrażających treść semantyczną zapytania obraz zapytania wyszukiwania (POS).

Wyszukiwanie odbywa się za pomocą zestawu terminów indeksujących. W celu zwiększenia efektywności wyszukiwania informacji na żądanie, POS może zostać uzupełniony o specjalne instrukcje dotyczące kolejności operacji logicznych w procesie wyszukiwania informacji, tzw. kolejność wyszukiwania.

Indeksowanie realizowane jest w procesach: podmiotyzacji, systematyzacji i indeksowania współrzędnych.

Systematyzacja – rodzaj indeksowania, w którym treść dokumentu i (lub) wniosku wyrażana jest za pomocą wskaźników klasyfikacyjnych, zgodnie z zasadami określonej klasyfikacji IP (KS). Ta zasada indeksowania jest uważana za klasyfikację. Zapewnia możliwość organizowania wyszukiwania informacji w sposób hierarchiczny. Specjaliści realizujący proces systematyzacji w bibliotekach i centrach informacji nazywani są systematyzatorami.

Subiektywizacja– rodzaj indeksowania, w którym treść dokumentu i (lub) wniosku jest wyrażona nagłówkiem tematycznym (SR) zgodnie z zasadami określonego FL tematycznego. Zasada indeksowania tematycznego opiera się na wykorzystaniu LE, które są częścią nagłówków tematycznych, język naturalny(tj. nagłówki tematyczne wyrażające POD i POP są zestawiane na podstawie języka naturalnego). Zasada indeksowania tematycznego umożliwia alfabetyczną organizację wyszukiwania informacji. Procesy podmiotyzacji realizowane są w bibliotekach i centrach informacyjnych przez podmiotowców.

Indeksowanie współrzędnych – rodzaj indeksowania, w którym treść semantyczna dokumentu i (lub) zapytania jest wielowymiarowo wyrażana za pomocą różnych słów kluczowych lub deskryptorów. Język przeznaczony do indeksowania współrzędnych nazywany jest językiem deskryptorów. Specjaliści zajmujący się indeksowaniem współrzędnych nazywani są indeksatorami.

Terminy „indeksowanie” i „indeksator” są powszechne w literaturze anglojęzycznej i są szeroko stosowane w międzynarodowej i krajowej praktyce bibliotecznej.

Zatem w zależności od rodzaju indeksowania wyróżnia się identyfikację podmiotu, klasyfikację i deskryptor FP. Obejmują one wiele LE i gramatyczne (paradygmatyczne i syntagmatyczne) relacje między nimi. LE jest oznaczeniem odrębnego pojęcia, przyjętego w IPL i niepodzielnego w tej funkcji. LE mogą reprezentować słowa akceptowane w języku naturalnym, wyrażenia zbiorcze, skróty, symbole, daty, ogólnie przyjęte skróty, istotne leksykalnie składniki złożonych słów, a także równoważny kod lub oznaczenia symboliczne języka sztucznego. Relacje gramatyczne pozwalają zorganizować LE w system.

Wymagania dotyczące IP:

· Całkowicie i dokładnie przekazać treść dokumentu odzwierciedloną w niniejszym IRS;

· Zapewnienie jednoznacznej interpretacji terminów indeksowanych;

· Zezwalaj na indeksowanie wieloaspektowe;

· Zezwalaj na zmiany (dodatki, poprawki);

· Zapewnić prostotę i wygodę indeksowania, wyszukiwania informacji i konserwacji niniejszego IRS;

· Odzwierciedlić aktualny stan systemu terminologicznego w tej dziedzinie wiedzy.

Zasady korzystania z IP są zapisane w aparacie referencyjnym i metodologicznym odpowiedniego IP.

Syntagma (gr. – zbudowane razem, połączone) to jedność semantyczna, która w pewnym kontekście wyraża się za pomocą słowa, grupy słów lub zdania. Poszczególne słowa (na przykład „metodologia”, „podręcznik”, „indeksowanie”) wchodzą w relacje syntagmatyczne w zdaniu za pomocą środków gramatycznych języka, takich jak deklinacja, koniugacja, przyimki, spójniki itp.

4. TEMAT: UNIFIKACJA I STANDARYZACJA INDEKSOWANIA DOKUMENTÓW.

Termin „indeksowanie” został wprowadzony do teorii i praktyki bibliotek krajowych w 1991 roku przez GOST 7.59 – 90 „Indeksowanie dokumentów. Ogólne wymagania dotyczące systematyzacji i podmiotyzacji”. Standard został wprowadzony w celu zastąpienia 3 poprzednich GOST opracowanych w latach 80-tych:

1. GOST 7.39 – 82 Systematyzacja i podmiotyzacja. Terminy i definicje.

2. GOST 7.44 – 84 Systematyzacja dokumentów. Wymagania ogólne.

3. GOST 7.45 – 84 Identyfikacja podmiotowa dokumentów. Wymagania ogólne.

Wszystkie te standardy zostały opracowane w ramach Systemu Standardów Informacji, Bibliotekoznawstwa i Wydawnictwa (SIBID), aby ujednolicić procesy indeksowania. Ostatecznym celem standaryzacji jest poprawa jakości i efektywności pracy – w tym przypadku jakości indeksowania oraz tych elementów aparatu referencyjnego i wyszukiwania, które są z indeksowaniem związane. Każdy standard rodzi się w wyniku uogólnienia wieloletniej praktyki.

Bibliotekarze uczyli się z podręczników i korzystali z pomocy praktycznych. Przez wiele dziesięcioleci nie istniały żadne normy regulujące procesy technologiczne. Pojawienie się scentralizowanego katalogowania (na przykład drukowanych kart katalogowych), systemu klasyfikacji wspólnego dla wszystkich lub wielu bibliotek, skłoniło bibliotekarzy do zrozumienia celowości stosowania wspólnych zasad i metod pracy. Na pewnym etapie rozwoju stosunków międzynarodowych pojawiła się potrzeba maksymalnego zharmonizowania krajowych praktyk katalogowania z zagranicznymi.

GOST 7.59 – 90 skupiał się na Międzynarodowej Normie MS ISO 5963 „Dokumentacja – metody analizy dokumentów, określaniu ich przedmiotu i wyborze terminów indeksowania” wprowadzonej przez Międzynarodową Organizację Normalizacyjną (ISO) w 1985 roku.

Międzynarodowy standard miał wiele zalet, które wzięli pod uwagę krajowi deweloperzy:

· Niezależną częścią normy były definicje występujących w niej terminów (w normach krajowych zostały one wyprowadzone z odrębnego GOST).

· Państwa członkowskie wprowadziły pojęcia i zdefiniowały ogólne wymagania, obejmujące zarówno systematyzację, jak i subiektywizację (w standardach krajowych procesy te zostały uznane za niezależne, niepowiązane procesy w odrębnych GOST).

Zalety ISO MS były oczywiste: łatwiej jest opanować dowolny proces, zwłaszcza zbiór procesów złożonych, takich jak systematyzacja i podmiotyzacja, jeśli rozróżnimy to, co ogólne, indywidualne i specjalne. Postanowiono połączyć standardy krajowe i maksymalnie zbliżyć je strukturą i treścią do standardów międzynarodowych. Ponadto konieczne było opracowanie standardu, którego zastosowanie nie byłoby ograniczone do granic wydziałów. Oznaczało to konieczność rozwiązania szeregu problemów terminologicznych, gdyż w tamtych latach w kraju funkcjonowały równolegle dwa systemy terminologiczne – biblioteka i informacja. Zdecydowano się zastosować w standardzie nowoczesną terminologię międzynarodową.

Podczas opracowywania GOST 7.59 - 90 przeprowadzono poważne badania naukowe nad wdrożeniem poprzednich standardów. Zatem GOST 7.44 - 84 przewidywał obowiązkowe utrzymanie we wszystkich bibliotekach alfabetycznego indeksu tematycznego (ASU) do katalogu systematycznego - nie jako urządzenia pomocniczego, ale jako integralną część katalogu. Dlatego zalecono sporządzenie karty APU w procesie przetwarzania nowych paragonów. Wymóg ten opierał się na współczesnych wyobrażeniach, że zakład ubezpieczeń jest w stanie wykonywać swoje funkcje, jeśli zostanie wyposażony w odpowiedni system kontroli. Wprowadzono także obowiązkową edycję decyzji klasyfikacyjnej i tytułów przedmiotowych APU. W związku z tym zmieniono krajowe standardy czasu.

Ankieta wykazała, że ​​procesy te przeprowadziły setki bibliotek, jednak wraz z wprowadzeniem GOST stały się one obowiązkowe dla wszystkich bibliotek.

Od stycznia 2004 r. GOST 7,59 - 2003 „Indeksowanie dokumentów. Ogólne wymagania dotyczące systematyzacji i podmiotyzacji”.

Zgodnie ze współczesnymi wymogami GOST 7.59 – 2003 „Indeksowanie dokumentów” składa się z 6 sekcji. Struktura GOST jest następująca:

Kilka lat później opracowano i wprowadzono w życie kolejny standard, uwzględniający trzeci proces indeksowania - GOST 7.66 - 92 „Indeksowanie dokumentów. Ogólne wymagania dotyczące indeksowania współrzędnych”, który również został oparty na zasadach normy ISO 5963.

Minęło ponad dziesięć lat. Na przestrzeni lat praktyki klasyfikacyjne w kraju uległy zmianie. W wielu bibliotekach pojawiły się zautomatyzowane systemy i katalogi elektroniczne. Konieczne było doprecyzowanie wykazu i nazw systemów klasyfikacyjnych. Terminologia rozpatrywanej tematyki została znacznie uproszczona. Zatwierdzono standardy terminologiczne:

· GOST 7,73 – 96 SIBID. Wyszukiwanie i rozpowszechnianie informacji. Terminy i definicje.

· GOST 7,74 – 96 SIBID. Języki wyszukiwania informacji. Terminy i definicje.

· GOST 7,76 – 96 SIBID. Zbiór dokumentów. Bibliografia. Katalogowanie. Terminy i definicje.

Od stycznia 2004 r. GOST 7,59 - 2003 „SIBID. Indeksowanie dokumentów. Ogólne wymagania dotyczące systematyzacji i podmiotyzacji.”

Zgodnie ze współczesnymi wymogami norma składa się z 6 sekcji. Struktura GOST jest następująca:

1. Zakres stosowania

3. Definicje

4. Postanowienia ogólne

4.1 Istota indeksowania

4.2 Indeksowanie obiektu

4.3 Warunki indeksowania

4.4 Zasady indeksowania

4.5 Rodzaje własności intelektualnej i warunki indeksowania

5. Wymagania dotyczące własności intelektualnej

5.1 Wymagania ogólne

5.2 Wymagania dotyczące klasyfikacji IP

5.3 Wymagania dla tematycznego PR

6. Procesy technologiczne i ogólne zasady indeksowania

6.1 Ogólne zasady indeksowania

6.2 Zasady systematyzacji

6.3 zasady wyszczególniania.

GOST 7.59 – 2003 ustanawia ogólne wymagania dotyczące indeksowania: systematyzacja i podział dokumentów oraz języki wyszukiwania informacji używane do indeksowania. Standard przeznaczony jest dla bibliotek, jednostek informacji naukowo-technicznej, izb książkowych, redakcji i wydawnictw.

W czasopiśmie „Biblioteka”, począwszy od drugiego numeru 2004, w rubryce „Nauki o bibliotekach” prowadzona jest „Szkoła Indeksowania” E.R. Sukiasyan, gdzie publikowany jest materiał komentujący treść GOST na temat indeksowania.

Wybór redaktora
Podatek od wartości dodanej nie jest opłatą bezwzględną. Podlega mu szereg rodzajów działalności gospodarczej, inne natomiast są zwolnione z podatku VAT....

„Myślę boleśnie: grzeszę, jest mi coraz gorzej, drżę przed karą Bożą, ale zamiast tego korzystam tylko z miłosierdzia Bożego. Mój grzech...

40 lat temu, 26 kwietnia 1976 r., zmarł minister obrony Andriej Antonowicz Greczko. Syn kowala i dzielnego kawalerzysty, Andriej Greczko...

Data bitwy pod Borodino, 7 września 1812 roku (26 sierpnia według starego stylu), na zawsze zapisze się w historii jako dzień jednego z najwspanialszych...
Pierniki z imbirem i cynamonem: piecz z dziećmi. Przepis krok po kroku ze zdjęciami Pierniki z imbirem i cynamonem: piecz z...
Oczekiwanie na Nowy Rok to nie tylko udekorowanie domu i stworzenie świątecznego menu. Z reguły w każdej rodzinie w przeddzień 31 grudnia...
Ze skórek arbuza można przygotować pyszną przekąskę, która świetnie komponuje się z mięsem lub kebabem. Ostatnio widziałam ten przepis w...
Naleśniki to najsmaczniejszy i najbardziej satysfakcjonujący przysmak, którego receptura przekazywana jest w rodzinach z pokolenia na pokolenie i ma swój własny, niepowtarzalny...
Co, wydawałoby się, może być bardziej rosyjskie niż kluski? Jednak knedle weszły do ​​kuchni rosyjskiej dopiero w XVI wieku. Istnieje...