5
ответов

Какие технологии базы данных большие поисковые системы используют? [закрытый]

Кто-либо знает, как Google или Yahoo выполняют поиски ключевых слов против очень очень огромных объемов данных? Какую базу данных или технологии они используют для этого? Требуется немного миллисекунд...
01.06.2012
5
ответов

Полнотекстовый индекс SQL Server 2008 года никогда, кажется, не завершается

Наш веб-сайт имеет базу данных SQL Server 2008 R2 Express Edition с полнотекстовым индексированием для нашего поиска веб-сайта. Каждый раз новая запись добавляется или обновляется в одной из индексированных таблиц, индексации...
17.11.2011
4
ответа

Свойство PopulationStatus не доступно для FullTextCatalog …, Как зафиксировать?

Я создал новый каталог (нечувствительный к регистру, сделайте каталог по умолчанию), когда я пытаюсь щелкнуть правой кнопкой> свойства для добавления таблиц, я получаю эту ошибку: Свойство PopulationStatus не доступно для...
08.04.2011
3
ответа

Оптимизация ORDER BY в запросе полнотекстового поиска

У меня есть большая таблица объекты с ~ 15M записи. Я хочу найти лучшие 5 строк, соответствующих 'хоккею' на их имя. У меня есть полнотекстовый индекс на имени, которое используется: gin_ix_entity_full_text_search_name Query:...
08.01.2020
3
ответа

Полное сканирование таблицы даже после добавляющего индекса

у меня есть две таблицы в сервере 11 г Oracle, каждый делится, и у другого есть 3 ГБ данных. Я добавил сводный индекс на обоих таблицы на основе, где пункт, в порядке это появляется...
05.07.2014
3
ответа

Полнотекстовый поиск с PostgreSQL

у меня есть таблица с этим, располагает в ряд: Этикетки------------------------------------------------------идентификатор | Заголовок |Keywords (ts_vector)------------------------------------------------------...
25.01.2013
3
ответа

Какая база данных является лучшей для очень встроенной базы данных или через DLL C?

Я хочу очень встроенную базу данных. Очень встроенный означает, что сервер запущен приложением и закрыт приложением без tcp/ip или 0 портов. Основные функции соображения:...
28.02.2012
3
ответа

Как LIKE реализована?

Кто-либо может объяснить, как оператор LIKE реализован в текущих системах баз данных (например, MySQL или Пост-ГРЭС)? или укажите на меня на некоторые ссылки, которые объясняют это? Наивный подход должен был бы осмотреть...
18.01.2012
2
ответа

Замедлите mysql полнотекстовый запрос

У меня есть немного проблемы с производительностью mysql-запроса, который использует полнотекстовый индекс. Следующий запрос ВЫБИРАЕТ Mention.id ИЗ упоминаний Упоминание AS ГДЕ (СООТВЕТСТВИЕ ('Упоминание'.'title_text', '...
08.01.2020
2
ответа

Полнотекстовый поиск SQL Server - .rtf файлы неправильно индексируется тегами rtf

Я настроил полнотекстовый индекс на своем SQL Server DB на varbinary (макс.) столбец. Мне указали столбец типа, который содержит расширение файла, такого ".doc", ".pdf" и т.д. Однако, я имею...
06.11.2017
2
ответа

SQL Server 2012: Полнотекстовый каталог, поднимающий все дисковое пространство

Мы создали полнотекстовый каталог и индекс для довольно большой таблицы. Столбец, на котором создается индекс, имеет тип данных varchar (макс.). Проблема запустилась, как только мы запустили...
31.12.2015
2
ответа

Полнотекстовый каталог, не заполняющий

Я просто создал полнотекстовый каталог: Включите полный текст (щелчок правой кнопкой по дб =>, файл => включает ful текстовую индексацию), Создают каталог (устройство хранения данных => текстовый Каталог Fulle => Новый Каталог => "FTCa
01.07.2014
2
ответа

Используя подстановочные знаки в БЛИЗОСТИ в Полнотекстовом поиске

Скажем, у меня есть следующий текст где-нибудь в документе, хранившем в индексированной таблице FT в SQL Server minsitry образования и науки, я хочу, чтобы запрос гарантировал, что слова РЯДОМ, но...
23.06.2014
2
ответа

Ошибка DBI1011I при использовании db2iupdt для включения текстового Поиска

Я пытаюсь включить текстовый Поиск в своем экземпляре DB2. Я выполняю эту команду: #/opt/ibm/db2/V10.5/instance/db2iupdt db2inst1-j "TEXT_SEARCH, db2j_db2inst1,55000" я получаю эту ошибку: DBI1011I...
22.02.2014
2
ответа

Как я использую словарь Ispell с текстовым поиском Пост-ГРЭС?

Пост-ГРЭС может использовать Ispell-совместимые словари в текстовом поиске, но не обеспечивает необходимые файлы.
19.01.2014
2
ответа

SQL Server 2012 - [закрытая] ошибка стоп-слова

Я делаю упражнение в книге сертификации Microsoft 70-461 (записанный Itzik Ben-Gan) В главе Полнотекстовые данные С 6 запросами. Я выполняю следующий запрос для создания списка стоп-слова. Система показала мне...
31.12.2013
2
ответа

использовать полнотекстовый поиск или нет?

В моем веб-приложении у меня есть веб-страница для администраторов, которая отображает следующие поля: (числовое) описание устройства идентификатора (числового) устройства идентификатора пользователя (текст) сотовый телефонный номер (текст) имя пользовате
23.10.2013
2
ответа

Разрабатывая пользовательскую таблицу, FName LName v.s Имя пользователя

Я провел некоторое исследование на различных способах получить имя пользователя. Некоторые разработчики базы данных предпочитают иметь имя пользователя, которое содержит имя и фамилию с разделителем пространства и некоторых других разработчиков...
26.08.2013
2
ответа

Как я избегаю дублирующихся строк с помощью FREETEXT?

У меня есть следующий запрос: ВЫБЕРИТЕ кошку. CategoryId, кошка. CategoryName, кошка. CategoryImageURL, кошка. CategoryImageData, AP. AppName, AP. AppImageData, AP. AppDetails, AP. AppId ОТ кошки Категорию, Приложение AP, ГДЕ...
13.08.2013
2
ответа

Полнотекстовый каталог не позволяет мне совершать нападки на формах единственного числа

Я создал полнотекстовый каталог для столбца под именем базы данных-> "устройство хранения данных"-> Полнотекстовые каталоги. Это - чувствительный к диакритическим знакам и "каталог по умолчанию", имеет значение false. Язык для ст
30.07.2013
2
ответа

Полнотекстовый поиск, ограничивающий пользовательские возможности

У нас есть веб-сайт с полем поиска. Поиск использует столбец полнотекстового индекса. Однако мы просто канал наклона текст пользователь ввели в эту хранимую процедуру. CREATE PROCEDURE [dbo]. [SearchPages]...
07.06.2013
2
ответа

MySQL - SQL-оператор для тестирования минимальной длины слова 'ft_min_word_len'

Я пытаюсь понять Полнотекстовые индексы. Там некоторый SQL-запрос должен протестировать 'ft_min_word_len' переменную? Я попытался соответствовать четырем символам только в примере ниже, но он не работает. Почему...
24.04.2013
2
ответа

MySQL - большая база данных

Мне нужна инструкция для установки DBMS (MySQL или SQL Server 2008). Размер базы данных ожидается до 80-100GB через следующие несколько месяцев. Одна основная таблица будет содержать текстовое содержание как эссе. Может дескриптор MySQL такой...
08.04.2013
2
ответа

Поиск базы данных, которая поддерживает fulltext, но не соединяет таблицу, вставляет или обновляет

У меня есть программа, которая должна вставить и обновлять таблицу очень часто (200 +, вставляют или запросы на обновление в минуту), и эта таблица должна также поддерживать полнотекстовый поиск. Я в настоящее время использую MySQL...
24.11.2012
2
ответа

SQL Server 2005: необходимые площади Полнотекстового поиска

Существует ли способ вычислить пространство физического диска, требуемое для каталога полнотекстового поиска? Пространство является дешевым, но я хотел бы знать то, во что я вхожу. Я смотрю на таблицу приблизительно 200 статей...
13.08.2012
2
ответа

Полнотекстовый поиск пост-ГРЭС с несколькими столбцами, почему concat в индексе а не во времени выполнения?

Я столкнулся с полнотекстовым поиском в пост-ГРЭС за последние несколько дней, и я немного смущен индексацией при поиске через несколько столбцов. Документы пост-ГРЭС говорят о создании ts_vector...
23.03.2012
2
ответа

Рекомендуемая структура? %70 записей %30 чтений. 10M строка. 200 запросов/секунда. Выберите, обновите, вставьте, поиск

Followings - то, что я должен сделать на своем проекте: 1-, Если критерий поиска является новым и уникальным, то добавьте критерий поиска, 2-Шоу lastest искали 1 000 критериев поиска (я не должен хранить даты всего поиска...
09.02.2012
2
ответа

Как установить SQL Server местоположения полнотекстового каталога 2008/2012

Я хочу обновить свою базу данных SQL Server 2005 до SQL Server 2012. В SQL Server 2005 можно установить местоположение полнотекстового каталога при создании его. Но в SQL Server 2012 (и в SQL Server...
04.10.2011
2
ответа

То, что делает “GIN, не поддерживает полные индексные сканирования”, средние?

Я - новичок RDBMS, и у меня есть база данных PostgreSQL больше чем 50 миллионов строк, становясь повседневным. Существует столбец 'текст', который содержит сгенерированный человеком текст приблизительно 20 слов. Я должен быть...
12.09.2011
2
ответа

ts_rank в широком масштабе замедляет мой запрос, как я могу улучшить производительность?

Вот Столбец "общественности kb_article_contents" Таблицы определения таблицы | Тип | Модификаторы------------+----------+-----------article_id | smallint | не пустое содержание | текст | нет...
23.07.2011

Поиск текста набора документов или свободных текстовых полей в базе данных для нахождения тех, которые содержат слово или комбинацию слов.

Системы полнотекстового поиска используют структуру данных, названную инвертированным индексом. Логически инвертированный индекс состоит из ключа, содержащего слово и список документов, в которых появляется слово. Запись документа может также иметь взвешивание на основе частоты, с которой то слово появляется в документе. Взвешивание может также быть применено к критериям поиска.

Механизмы полнотекстового поиска определяют местоположение документов, соответствующих критериям поиска, и вычисляют близость соответствия с помощью эвристики, названной рейтингом косинуса. Это вычисляется путем формирования n-мерного вектора из критериев поиска и затем построения подобных векторов из результатов поиска. Скалярное произведение этих двух векторов является косинусом угла между этими векторами в n-мерном пространстве. Значение косинуса 1 указывает на параллельные векторы и самое близкое соответствие.

Обычно результаты поиска питаются в приоритетную очередь и затем высовываются в порядке от самого высокого косинуса, занимающего место к самому низкому. Некоторые системы также применяют коэффициенты к рейтингам косинуса на основе других факторов; самыми известными примерами этого является алгоритм PageRank Google.

Системы текстового информационного поиска обычно используют собственные механизмы, хотя много систем баз данных общего назначения также предлагают функцию полнотекстового поиска.