System Design. Машинное обучение. Подготовка к сложному интервью 🔍
Алекс Сюй, Али Аминиан Питер, Библиотека программиста, 1, 2024
俄语 [ru] · PDF · 6.6MB · 2024 · 📘 非小说类图书 · 🚀/lgli/lgrs · Save
描述
Собеседования по проектированию системы машинного обучения — самые сложные из всех вопросов технического собеседования. Эта книга предоставляет надежную стратегию и базу знаний для решения широкого круга вопросов проектирования систем машинного обучения. Пошаговый подход формирует основу для решения любого вопроса проектирования, используя множество реальных примеров.
Эта книга поможет всем, кто интересуется проектированием систем машинного обучения, будь то новички или опытные инженеры. Если вам нужно подготовиться к собеседованию по данной теме, эта книга создана специально для вас.
备用文件名
lgrsnf/System_Design.pdf
备用出版商
Progress kniga
备用版本
Russia, Russian Federation
元数据中的注释
Publisher's PDF
备用描述
Предисловие
Что такое собеседование по проектированию систем МО (ML System Design interview)
Почему это важно
Для кого эта книга
Чего нет в книге
Дополнительные ресурсы
Благодарности
От издательства
Глава 1. Введение и общие сведения
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор подходящей категории МО
Темы для обсуждения
Подготовка данных
Инженерия данных
Типы данных
Конструирование признаков
Операции конструирования признаков
Темы для обсуждения
Разработка модели
Выбор модели
Обучение модели
Темы для обсуждения
Оценка
Автономная (offline) оценка
Оперативная (online) оценка
Темы для обсуждения
Развертывание и эксплуатация
Развертывание в облаке или на устройстве
Сжатие модели
Тестирование при эксплуатации
Пайплайн предсказаний
Темы для обсуждения
Мониторинг
Почему в действующей системе происходят сбои
Какие показатели нужно отслеживать
Инфраструктура
Итоги
Ссылки
Глава 2. Система визуального поиска
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор подходящей категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Выбор модели
Обучение модели
Построение датасета
Выбор функции потерь
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Предсказательный пайплайн
Пайплайн индексации
Эффективность алгоритмов поиска ближайшего соседа (NN)
Какой алгоритм использовать?
Другие темы для обсуждения
Итоги
Ссылки
Глава 3. Система размытия в Google Street View
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор подходящей категории МО
Двухступенчатые сети
Одноступенчатые сети
Сравнение одноступенчатых и двухступенчатых сетей
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Выбор модели
Обучение модели
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Перекрытие ограничительных прямоугольников
Проектирование системы МО
Пайплайн пакетных предсказаний
Другие темы для обсуждения
Итоги
Ссылки
Глава 4. Поиск видео на YouTube
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Выбор модели
Обучение модели
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Предсказательный пайплайн
Пайплайн индексации видео
Пайплайн индексации текста
Другие темы для обсуждения
Итоги
Ссылки
Глава 5. Обнаружение вредоносного контента
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Выбор модели
Обучение модели
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Сервис обнаружения вредоносного контента
Сервис обработки нарушений
Сервис понижения приоритета
Другие темы для обсуждения
Итоги
Ссылки
Глава 6. Система рекомендации видео
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Матричная факторизация
Двухбашенная нейронная сеть
Работа двухбашенной нейронной сети
Матричная факторизация или двухбашенная нейронная сеть?
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Генерация кандидатов
Скоринг
Повторное ранжирование
Трудности при разработке систем рекомендации видео
Другие темы для обсуждения
Итоги
Ссылки
Глава 7. Система рекомендации событий
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор подходящей категории МО
Списочные методы LTR
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Выбор модели
Обучение модели
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Пайплайн оперативного обучения
Предсказательный пайплайн
Другие темы для обсуждения
Итоги
Ссылки
Глава 8. Предсказание кликов по рекламе на социальных платформах
Введение
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Признаки пользователя
Разработка модели
Выбор модели
Обучение модели
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Пайплайн подготовки данных
Пайплайн непрерывного обучения
Предсказательный пайплайн
Другие темы для обсуждения
Итоги
Ссылки
Глава 9. Похожие объекты на платформах краткосрочной аренды жилья
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Выбор модели
Обучение модели
Построение датасета
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Обучающий пайплайн
Индексирующий пайплайн
Предсказательный пайплайн
Другие темы для обсуждения
Итоги
Ссылки
Глава 10. Персонализированная лента новостей
Введение
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Определение входных и выходных данных системы
Выбор категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Признаки пользователей
Разработка модели
Выбор модели
Обучение модели
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Предсказательный пайплайн
Другие темы для обсуждения
Итоги
Ссылки
Глава 11. Списки возможных знакомых
Введение
Прояснение требований
Формулировка проблемы в виде задачи МО
Определение цели МО
Выбор категории МО
Подготовка данных
Инженерия данных
Конструирование признаков
Разработка модели
Выбор модели
Графовые нейронные сети (GNN)
Обучение модели
Оценка
Автономные метрики
Оперативные метрики
Эксплуатация
Эффективность
Проектирование системы МО
Другие темы для обсуждения
Итоги
Ссылки
Послесловие
开源日期
2024-01-21
更多信息……
We strongly recommend that you support the author by buying or donating on their personal website, or borrowing in your local library.

🚀 快速下载

成为会员以支持书籍、论文等的长期保存。为了感谢您对我们的支持,您将获得高速下载权益。❤️

🐢 低速下载

由可信的合作方提供。 更多信息请参见常见问题解答。 (可能需要验证浏览器——无限次下载!)

所有选项下载的文件都相同,应该可以安全使用。即使这样,从互联网下载文件时始终要小心。例如,确保您的设备更新及时。
  • 对于大文件,我们建议使用下载管理器以防止中断。
    推荐的下载管理器:JDownloader
  • 您将需要一个电子书或 PDF 阅读器来打开文件,具体取决于文件格式。
    推荐的电子书阅读器:Anna的档案在线查看器ReadEraCalibre
  • 使用在线工具进行格式转换。
    推荐的转换工具:CloudConvertPrintFriendly
  • 您可以将 PDF 和 EPUB 文件发送到您的 Kindle 或 Kobo 电子阅读器。
    推荐的工具:亚马逊的“发送到 Kindle”djazz 的“发送到 Kobo/Kindle”
  • 支持作者和图书馆
    ✍️ 如果您喜欢这个并且能够负担得起,请考虑购买原版,或直接支持作者。
    📚 如果您当地的图书馆有这本书,请考虑在那里免费借阅。