banner

Новости

Aug 31, 2023

Применение машинного обучения в классификации кедровых орехов

Научные отчеты, том 12, Номер статьи: 8799 (2022) Цитировать эту статью

1128 Доступов

2 цитаты

2 Альтметрика

Подробности о метриках

Кедровые орехи являются не только важным средством воспроизводства сосны и облесения, но и широко потребляемым орехом с высокой питательной ценностью. Однако кедровые орехи трудно отличить из-за морфологического сходства видов. Поэтому важно повышать качество кедровых орехов и решать проблему фальсификации быстро и неразрушающе. В этом исследовании в качестве исследуемых видов использовались семь кедровых орехов (Pinus Bungeana, Pinus yunnanensis, Pinus thunbergii, Pinus Armandii, Pinus Massoniana, Pinus elliottii и Pinus taiwanensis). 210 спектров ближнего инфракрасного диапазона (NIR) были собраны у семи видов кедровых орехов, пяти методов машинного обучения (дерево решений (DT), случайный лес (RF), многослойный персептрон (MLP), машина опорных векторов (SVM) и наивный байесовский метод). (NB)) были использованы для определения видов кедровых орехов. 303 изображения были использованы для сбора морфологических данных для построения модели классификации на основе пяти моделей сверточных нейронных сетей (CNN) (VGG16, VGG19, Xception, InceptionV3 и ResNet50). Экспериментальные результаты БИК-спектроскопии показывают, что лучшей моделью классификации является MLP, а точность приближается к 0,99. Другой экспериментальный результат изображений показывает, что лучшей моделью классификации является InceptionV3, а точность приближается к 0,964. Было обнаружено, что четыре важных диапазона волновых диапазонов: 951–957 нм, 1147–1154 нм, 1907–1927 нм, 2227–2254 нм тесно связаны с классификацией кедровых орехов. Это исследование показывает, что машинное обучение эффективно для классификации кедровых орехов, предоставляя решения и научные методы для быстрой, неразрушающей и точной классификации различных видов кедровых орехов.

Насчитывается более 113 официально признанных видов Pinus Linn, распространенных преимущественно в северном полушарии1, 2, они составляют важную часть лесных экосистем. Кедровые орехи — это семена сосен, они широко употребляются в пищу и являются важным фактором облесения и воспроизводства3. Кедровые орехи богаты белком, жирными кислотами, минералами и витаминами. Они также содержат олеиновую кислоту, линоленовую кислоту и другие ненасыщенные жирные кислоты, которые способствуют профилактике сердечно-сосудистых заболеваний4. Распознавание видов кедровых орехов важно для безопасности пищевых продуктов и качества кедровых орехов. В последние годы рост цен на кедровые орехи принес огромную экономическую выгоду. Мировой объем производства кедровых орехов в 2020–2021 годах составит около 381,7 тыс. тонн. Китай является основной страной-импортером и экспортером кедровых орехов в мире. Учитывая визуальное сходство кедровых орехов, вероятность фальсификации продуктов очень высока, а проблема фальсификации оказывает большое влияние на здоровье и экономику. Поэтому вопрос о том, как обнаружить фальсифицированные продукты в кедровых орехах удобным, быстрым и неразрушающим способом, является проблемой пищевой безопасности кедровых орехов.

В настоящее время распространенные методы идентификации видов включают морфологический анализ5, технологию молекулярных маркеров6,7,8,9, электрофорез белков10, жидкостную хроматографию11, спектральный анализ12,13,14 и распознавание изображений15. Морфологический анализ требует высокого уровня знаний, который нелегко приобрести, и поэтому из-за большого морфологического сходства между некоторыми видами уровень точной идентификации низок16. Хотя использование молекулярных маркеров обеспечивает более высокий уровень распознавания и большую точность, это деструктивный метод, требующий много времени и ограниченный количеством опубликованных маркеров в общедоступных базах данных. Таким образом, в этом исследовании создаются модели машинного обучения для классификации кедровых орехов на основе ближней инфракрасной (NIR) спектроскопии и изображений.

БИК-спектроскопия — это метод, который использует молекулярные колебания в инфракрасном спектре материала. Процесс БИК-спектроскопии включает в себя использование БИК-аппарата, излучающего инфракрасный свет, который попадает в образец. Здесь он отражается, преломляется, рассеивается и поглощается и, наконец, переносит информацию об образце обратно в детектор. Эта методология удобна, быстра, неразрушительна и экономически эффективна. Он использовался во многих областях сельского хозяйства, включая исследования производства пшеницы17, сои18, вигны19 и риса12. До сих пор имеется мало сообщений о применении БИК-спектроскопии в лесном хозяйстве и исследованиях кедрового ореха. В частности, Тигабу и др.20 собрали спектральные данные в видимом ближнем ИК-диапазоне орехов Pinus sylvestris в различных областях и предварительно обработали спектральные данные с помощью мультипликативной коррекции рассеяния (MSC). Источник орехов был создан с помощью мягкого независимого моделирования аналогии классов (SIMCA) и частичного дискриминантного анализа наименьших квадратов (PLS-DA). Loewe et al.21 собрали спектральные данные NIR средиземноморской Pinus pinea с чилийских плантаций для классификации. Москетти и др.22 собрали данные NIR-спектров орехов P. pinea и Pinus sibirica в разных регионах и создали модель спектральной классификации с использованием методов PLS-DA и Interval PLS-DA (IPLS-DA). Однако влияние других классификационных моделей еще требует дальнейшего обсуждения на большем количестве видов кедровых орехов.

 0.80, with MLP and SVM providing an accuracy of > 0.93. With pre-process of data, the performance of the MLP and SVM models have been greatly improved, the accuracy of the MLP model reaches 0.99, while the SVM model reaches 0.94. Overall, these results show that the RF model is a better classification method when the data are not normalized, while the MLP model is the best for normalized data./p>

ДЕЛИТЬСЯ