PROJECT: VISUAL IDENTIFICATION OF WOOD QUALITY

# Python# Spark# Flask# MySQL# AWS
# SQL# Hadoop# Django# PostgreSQL# Azure
# VBA# Kafka# SQLite# GCP
# Flink# MongoDB# cloud on-premises
time: May 2014 – May 2018
role: Data Scientist 
company: KRONOSPAN

Kronospan, a company that mass-produces chipboard – the main raw material for the furniture industry, received huge amounts of wood waste. These waste materials varied in quality, and every truck delivering wood chips, recycled wood, or wood chunks was automatically photographed from multiple angles. The photos were taken both during the day and at night, in various weather conditions. With tens of thousands of photographs and cases where poor wood quality had been identified, I decided to build a neural network using the PyTorch library to automate the process of identifying wood quality.

PROJECT IMPLEMENTATION

Ultimately, the project was not completed due to difficulties in training the model. The neural network model struggled to learn which wood waste was of poor quality. One of the main reasons for this was the fact that a large portion of poor-quality wood waste was incorrectly classified by humans as good-quality waste. This inconsistency in human quality assessment made it difficult for the model to understand and learn to recognize poor wood quality from the available data. Despite the use of Data Science techniques, such as deep learning, the classification models were unable to achieve the desired results.


PROJEKT WIZUALNEJ IDENTYFIKACJI JAKOŚCI DREWNA

Firma Kronospan, masowo produkująca płyty wiórowe – główny surowiec dla przemysłu meblarskiego, przyjmowała ogromne ilości odpadów drewnianych. Odpady te były różnej jakości, a każda ciężarówka dostarczająca wióry, recyklingowane drewno czy kawałki drewna była automatycznie fotografowana z różnych stron. Zdjęcia były robione zarówno w dzień, jak i w nocy oraz w różnych warunkach atmosferycznych. Mając do dyspozycji dziesiątki tysięcy fotografii oraz przypadki, w których stwierdzono złą jakość drewna, postanowiłem zbudować sieć neuronową przy użyciu biblioteki PyTorch, aby zautomatyzować proces rozpoznawania jakości drewna.

REALIZACJA PROJEKTU

Ostatecznie projekt nie został zrealizowany z powodu trudności z wyuczeniem modelu. Model oparty na sieciach neuronowych nie potrafił skutecznie nauczyć się rozpoznawania odpadów drewnianych o złej jakości. Jednym z głównych problemów był fakt, że duża część odpadów drewnianych o złej jakości była błędnie klasyfikowana przez ludzi jako odpady dobrej jakości. Ta niespójność w ocenie jakości drewna przez ludzi sprawiła, że model nie mógł właściwie zrozumieć i nauczyć się, jak rozpoznawać złą jakość drewna na podstawie dostępnych danych. Pomimo zastosowania technik związanych z Data Science, takich jak deep learning, modele klasyfikacyjne nie były w stanie osiągnąć zamierzonych wyników.