It is a full-text search system (desktop search) designed to be easily used by common people. It provides the text search on personal computer, local area network (shared resources) and Internet resources (HTTP and FTP sites) with simple interface. The documents can be indexed to provide faster and easier searching. It is possible to create a lot of separated indexes, CD/DVD or group of web sites. These indexes can be arranged as a tree - see cataloguer windows description for details. Программа Integra позволяет организовывать данные на жестких дисках компьютера, ресурсах локальной сети и компакт-дисках для быстрого поиска с учетом морфологии русского и английского языков, включая синонимы и грамматически связанные слова. Она имеет простой пользовательский интерфейс, позволяющий добавлять CD с документами в персональный каталог буквально в три шага. Все проиндексированные документы организуются удобным для Вас способом в каталогизаторе. The main goal of the project is to implement desktop search tools (full text search engine) for users (download page) and C++ supplementary library with simple API for software developers. Like other text search tools our software finds the text patterns in files on personal computer, local area network and internet sites. What makes these search tools special is a set of features that are listed here. For example, there are few desktop search tools available for users (small tools are of no interest), but none of them is able to handle Russian morphology and syntax. More to say, there is no tool which can search for Russian text in document written in English, and vice versa. Key features include: 1. Open source codes (LGPL) for all tools and components. Other open source projects are also intensively used. 2. Sample programs for search engine (Win32 and .NET platforms) are available in source codes. 3. Search engine API is very simple (less then dozen functions) but allows full support for search engine features. 4. Archived and packed files (see the list of supported formats) are processed without external unpackers for the most popular formats. Search on local host disks, removable drives (CD, DVD), local network and internet (crawling the www hyper references). 5. Text extraction algorithm for unknown format files (ASCII, utf8 and utf16 are supported). Language and codepage guesser module. 6. Search results are represented in several formats including plain TXT, HTML, XML, SQL scripts. 7. Console tool (faind) and GUI tool (Integra) are available. 8. Queries can include logic operators (boolean search), regular expressions and extended regular expressions (natural language grammar operator). 9. Built-in support for natural languages morphology and syntax (grammar engine). This feature is optional and can be disabled. 10. Fuzzy search (aka partial word matching) features. 11. Built-in translation module allows search in mixed language texts. 12. Knowledge discovery and information retrieval features, including "natural language queries answering machine". 13. Built-in indexer works without external (back-end) RDBMS. The indexer allows several modes for indexing and searching. Особенности программы * Полная поддержка русского языка, включающая полностью русский интерфейс, поддержка кириллицы в именах файлов, аккуратная работа с русской морфологией и синтаксисом, автопределение кодировок текста win1251, dos 866, koi8 в ASCII текстах, возможность учета синонимов и автоматического перевода слов при поиске. * Встроенный каталогизатор: неограниченное количество индексов, визуальные средства построения иерархии групп индексов, поиск в выбранной группе индексов, поиск в именах файлов или полнотекстовый поиск, пошаговый мастер создания новых индексов с готовыми типичными сценариями. * Поиск в архивах основных распространенных форматов: zip, rar, 7zip, arj, bzip2, tar, gzip, ace, lha, chm, cab, chm, iso-образы * Поиск в документах самых распространенных форматов: PDF, MS Office (Word, Excel, Visio, PowerPoint, Access), RTF, OpenOffice (Write, Calc, Презентации), DjVu, Microsoft Office Document Imaging, веб-страницы, простые текстовые форматы в разных кодировках, аудио-файлы mp3, ogg, Windows Media (wmv, wma), изображения tiff, jpeg, tiff. * Модуль распознавания текста (OCR) для документов DjVu * Встроенный просмотр найденных документов, включая офисные PDF, DjVu, DjVu, MS Office и OpenOffice, большое количество графических форматов, цветовое выделение ключевых слов запроса в документах, а также подсветка синтаксиса для текстов программ, встроенный проигрыватель аудио и видеодокументов, поддержка плагинов * Автоматическое обновление индекса при изменении документов, фоновая переиндексация жестких дисков. * Возможность интеграции с Windows Indexing Service - встроенной поисковой службой ОС Windows версий 2000, XP и Vista. * Особые возможности при работе в локальной сети, включая встроенный сканер доступных компьютеров * Поиск в интернете, включая агрегирование данных с поисковых машин и индивидуальное индексирование FTP и WWW сайтов. Update: Sep 21, 2009 Supported Platforms: Windows 2000/XP/Vista Multilingual user interface (English, Russian) Licence: Freeware Developer: Solarix Size: 19.8 Mb |