В понедельник выверну одну веселую задачку наизнанку

Пришла куча текстовых полей. Примерно с десяток тысяч. В каждом поле символов этак 500+

В том числе в произвольном месте текста может быть указан телефон в любом формате: 8-123-456-78-90 +7-123-456-78-90 8-(123) 456-78-90 123 456 78 90

Также имеется справочник телефонов сотрудников.

Так вот... Нужно по тексту понять для каждой записи телефон кого из сотрудиков упоминается)

Конечно же предварительно чистить все поля от всего, кроме цифр - не наш вариант. Это долго, дорого и больно. Нужно рисовать под это функцию, она будет работать медленней улитки, а стандартных механизмов для этого нет ни в эксель, ни в sql...

Решил зачистить текст от спец-символов для того чтобы все номера получились вида 1234567890. В этом случае можно будет зайти со стороны справочника сотрудников и получить желаемое, отвечая на вопрос: "А в каких записях был упомянут телефон сотрудника Васи". Вместо "Какой сотрудник упомянут в этой конкретной записи".

И для ответа на первый вопрос будет достаточно искать записи с вхождением искомого телефона)

Иногда полезно выворачивать задачу наизнанку чтобы получить решение.

Жду, не дождусь понедельника, чтобы накинуться на эту задачку))

А вы чего ждете от понедельника?))

В понедельник выверну одну веселую задачку наизнанку | Сетка — новая социальная сеть от hh.ru
repost

250

input message

напишите коммент

· 01.12

Самый простой вариант зачистить номера и взять правые 10 символов. Которые сравнить со справочником.

ответить

· 04.07

Нужны варианты написания телефонов сотрудников. +7, 7,8, без префикса. Итого 4 варианта для проверки.

ответить

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь