Head of Content Yandex · 26.02 · ред.
Неочевидное использование GPT для работы с данными
В последние полгода я часто юзаю GPT для работы с большими объемами данных. Хочу поделиться несколькими кейсами.
1. Шаблоны
Задача: есть excel (CSV) файл с характеристиками по 2800 категорий, необходимо сделать шаблоны под каждую категорию, где в заголовках столбцов вначале во всех категориях будут одинаковые поля, такие как "название товара", "цена", и т.д., а далее - характеристики, у каждой категории свои.
Решение: поставить задачу в команду разработки.
А что если команды разработки нет, она занята другими задачами или нет времени на "ждать"?
Современное решение: идем в GPT, описываем входящий файл, что хочется получить на выходе и просим написать скрипт на питоне.
Далее просим научить как этим всем пользоваться.
По инструкции GPT устанавливаем всё необходимое на комп, запускаем скрипт и спустя 2 часа мучений у нас есть 2800 шаблонов.
2. Разложить данные
Задача: есть данные в 50 файлах в формате (см. ниже), нужно разложить их по столбикам, где название столбиков - это то, что до =, а значение в ячейке то, что после =, и вернуть это новыми 50 файлами.
Исходные данные:
Номер по порядку=1;Имя=Лена;Возраст=35;Фамилия=Иванова;Любимый цвет=Красный;Любимое блюдо=Котлеты с пюрешкой
Номер по порядку=2;Любимый цвет=Желтый;Возраст=35;Фамилия=Сергеева;Имя=Анна;Любимое блюдо=Котлеты с пюрешкой
Возраст=25;Любимый цвет=Черный;Фамилия=Колосовская;Любимое блюдо=Леопард с соусом из виски;Имя=Маргарита;Номер по порядку=3
Номер по порядку=4;Имя=Лена;Любимый цвет=Белый;Возраст=45;Фамилия=Герц;Любимое блюдо=Салат с креветками
Номер по порядку=5;Любимый цвет=Красный;Любимое блюдо=Медовик;Имя=Слава;Возраст=31;Фамилия=Петров
Решение: поставить задачу в команду разработки или попробовать нафигачить кучу формул в Excel в 50 таблицах, а может быть даже написать/записать макрос.
Уже знакомое быстрое решение: идем в GPT, описываем входящий файл, что хочется получить на выходе и просим написать скрипт на питоне, да так, чтобы он обрабатывал сразу все файлы, лежащие в указанной папке.
Устанавливать и учиться уже не нужно, просто запускаем срипт и через 10 минут получаем готовый результат.
· 26.02
Да, это хороший вариант работы с данными из справочников, но не все данные можно показывать чату, значит их можно маскировать ! Спасибо за подробное описание
ответить
26.02
Через GPT вы пишите именно скрипт. Для примера данные можно сделать просто придуманные. А скрипт уже работают на вашем компе и данные никуда не уходят. Т.е. вы фактически запускаете кусок кода локально у себя на устройстве и этот код обрабатывает ваши данные, а GPT вам помогает написать этот код, но данные не обрабатывает. Ему нужно дать пример данных и написать, что в итоге вы хотите получить
ответить
еще контент автора
еще контент автора
Head of Content Yandex · 26.02 · ред.
войдите, чтобы увидеть
и подписаться на интересных профи