Windows - Indexelő szolgáltatás: elméleti tudnivalók

Indexelő szolgáltatás 1. rész

A Windows 2000 minden verziója tartalmaz egy szolgáltatást a merevlemezen lévő dokumentum fájlok nevének, tulajdonságainak és tartalmának indexelésére. Nagyobb állománymennyiség esetén a keresések ezáltal jelentősen felgyorsulnak. Nem csak a külső paraméterekben (fájlnév, kiterjesztés, stb.), hanem tartalomban is lehet keresni. A fájlokat és tulajdonságaikat egy katalógusban tárolja és a keresés történhet a Windows eszközeivel (pl.: Internet Explorer), de egyéb programokkal is. Az előbbiek nem igényelnek semmilyen beállítást, teljesen automatikusan képesek együttműködni a szolgáltatással. Vannak viszont olyan programok (főleg nagy dokumentum adatbázissal rendelkezők), amelyek nem hajlandók az indexelő szolgáltatás nélkül futni, mert bármiféle keresés túl hosszú időt venne igénybe és a tervezők ezt eleve ki akarják zárni.

Hardver feltételek:

Amíg nem dolgozunk nagyon nagy adatbázissal, a Windows 2000 Server operációs rendszer hardverigénye megfelelő. Ez kisebb vállalatok néhány 10 gépének adataira értendő.
500 000 vagy annál több dokumentum kezeléséhez minimum 256 de inkább 512 MB RAM javasolt. Ha ennek az adatmennyiségnek a többszörösét kívánjuk használni, célszerű egy gépet csak az indexelés céljára fenntartani. Alapvetően a processzor gyorsasága és a memória mennyisége határozza meg a teljesítményt.

Szoftver feltételek:

Célszerű NTFS fájlrendszert használni, noha a szolgáltatás működik FAT32 alatt is. Az NTFS fájlrendszeren az indexeléshez szükséges átmeneti állományok által elfoglalt hely jelentősen kevesebb.
A rendszer kezeli az NTFS hozzáférési jogosultságokat: ha valaki nem jogosult egy dokumentumot megtekinteni, a keresés eredményében nem is jelenik meg. Míg FAT fájlrendszernél nem használhatjuk ezt a funkciót és csak felesleges adatokkal növekszik a találati szám.

További feltételek:

A szolgáltatás képes a hálózaton lévő dokumentumokat is katalogizálni. Azonban ezeknél nem végez ellenőrzést arra vonatkozóan, hogy az adott felhasználó rendelkezik-e a hálózati erőforrások eléréséhez szükséges jogokkal.

A szolgáltatásnak az indexelés elvégzéséhez olvasási joggal hozzá kell férnie az állományokhoz. Ezt nem az aktuálisan bejelentkezett felhasználó azonosítójával, hanem a rendszerfiókkal (system) teszi. Ha egy dokumentumnál a hozzáférése le van tiltva, nem fogja tudni az indexelést elvégezni.

Nem indexelődnek a titkosított állományok. Ha indexelés után történik meg egy dokumentum titkosítása, a rendszer törli a katalógusból.

A katalógus elhelyezhető bárhol a merevlemezen és felhasználható helyileg, a hálózaton keresztül, de akár az Interneten keresztül is. Azonban soha nem szabad az Internetes szolgáltatás mappájában tárolni, mert az IIS indexelő rendszere is indexelheti és ez ütközéshez vezet.

Mit képes a szolgáltatás indexelni?

A következő dokumentumokat: HTML, TXT, XLS, DOC, RTF, EML és minden olyan dokumentumot, amelyhez rendelkezésre áll a rendszerben dokumentumszűrő. Tehát a fentieken kívül minden Microsoft Office által kezelt dokumentumot, e-mail-t, weblapot, stb.
A keresés során hivatkozhatunk fájlnévre, hosszra, szerző nevére, egy dokumentum részletre vagy akár csak egy szóra, stb.

Az indexelés folyamata:

A dokumentumszűrő segítségével megnyitja az állományt végigolvassa és egy kivonatot készít belőle, amit az indexben tárol. A dokumentum tartalmát a nyelvezetének megfelelően szavakra bontja és az úgynevezett kivétellistán található szavakat (pl. névelőket) törli belőle. Ami ezek után megmarad ismét az indexbe menti. Ebből következik, hogy a szolgáltatás nyelvfüggő és csak az általa ismert nyelvezetnek megfelelő szövegeket képes hatékonyan kezelni. A kivétellisták a merevlemez %systemroot%\system32 mappájában "noise.xxx" néven találhatók, ahol az "xxx" az adott nyelv kódját jelenti.

Katalógusok:

Minden indexinformáció katalógusokban tárolódik. Ha a szolgáltatás az operációs rendszerrel egyidejűleg került telepítésre, automatikusan keletkezik egy rendszer katalógus benne a fix lemezmeghajtókon található dokumentumok adataival. Ha IIS is lett telepítve, létrejön még egy katalógus, amelyben a Web mappák állományainak indexe szerepel.

A következő részben az index szolgáltatás gyakorlati megvalósításával foglalkozunk.

Indexelő szolgáltatás cikksorozat

Indexelő szolgáltatás: elméleti tudnivalók - Indexelő szolgáltatás 1. rész

Indexelő szolgáltatás: gyakorlati megvalósítás - Indexelő szolgáltatás 2. rész