07.07.2022 Новости, Искусственный интеллектСогласно недавнему опросу более 1300 специалистов-практиков в области машинного обучения, качество данных является самой большой проблемой, с которой сталкиваются команды МО при получении обучающих данных, сообщает портал AI Business. Треть респондентов опроса «Zeitgeist: AI Readiness Report by Scale AI» заявили, что сталкиваются с проблемами качества данных, далее следуют вопросы сбора, анализа, хранения и версионирования. Эти проблемы необходимо решать, поскольку они оказывают значительное последующее влияние на МО-усилия, а команды часто не могут эффективно моделировать без качественных данных, говорится в отчете. Команды MО заявили, что им трудно разобраться с объемом, сложностью и нехваткой данных. Особую проблему представляют неструктурированные данные. Практики считают, что подбор данных для своих моделей влияет на то, как быстро они могут развернуть свои MО-проекты. Без высококачественных данных команды не могут создавать надежные модели. К факторам, влияющим на качество данных, относятся разноообразие, объем и шум. По данным опроса, 37% испытывают трудности с поиском разнообразных данных, необходимых для повышения производительности моделей. Те, кто работают с неструктурированными данными, испытывают наибольшие трудности с получением разнообразных данных для повышения производительности модели. Поскольку большинство данных сегодня являются неструктурированными, команды МО должны иметь стратегию управления ими для повышения качества данных. Команды МО, работающие с ...
читать далее.