Hier finden Sie Publikationen, Pressemitteilungen und weitere Downloads zum GCA.

Wollen Sie Kontakt zu uns aufnehmen? Schreiben Sie uns unter info[at]green-consumption-assistant.de

Wissenschaftliche Publikationen

GreenDB: Toward a Product-by-Product Sustainability Database

Eines unserer Projektziele ist der Aufbau einer KI-basierten Produktdatenbank, die das Entwickeln eines Empfehlungs-Assistenten ermöglicht. In diesem Preprint wird erläutert, wie mithilfe von Scraping-Technologien öffentlich zugängliche Daten über Produkte und Informationen über deren Nachhaltigkeit abgefragt und in eine zentrale Datenbank integriert werden können. Des Weiteren wird die erste Version der GreenDB präsentiert und veröffentlicht. Weitere Informationen finden Sie hier.

Paper in "Frontiers in Big Data"

Paper: A Benchmark for Data Imputation Methods [Eng.]

Die Verbesserung der Datenqualität von Anwendungen, die Maschinelles Lernen (ML) nutzen, hilft nicht nur deren Performance zu erhöhen, sondern ermöglicht es auch, dass effizientere Modelle verwendet werden können. Eines der häufigsten Datenqualitätsproblem sind fehlende Werte (missing values). In diesem peer-reviewed Artikel haben Sebastian Jäger, Arndt Allhorn und Felix Bießmann auf Basis unterschiedlichster Datensätze verschiedene Methoden verglichen, die zum Vorhersagen dieser Fehlstellen, die uns in Bezug auf nachhaltige Produktempfehlungen immer wieder begegnen, verwendet werden können. Abschließend werden Empfehlungen für unterschiedlichste Situationen ausgesprochen, die auf den Ergebnissen unserer Experimenten beruhen.

doi:10.14778/2994509.2994518

Abstract

With the increasing importance and complexity of data pipelines, data quality became one of the key challenges in modern software applications. The importance of data quality has been recognized beyond the field of data engineering and database management systems (DBMSs). Also, for machine learning (ML) applications, high data quality standards are crucial to ensure robust predictive performance and responsible usage of automated decision making. One of the most frequent data quality problems is missing values. Incomplete datasets can break data pipelines and can have a devastating impact on downstream ML applications when not detected. While statisticians and, more recently, ML researchers have introduced a variety of approaches to impute missing values, comprehensive benchmarks comparing classical and modern imputation approaches under fair and realistic conditions are underrepresented. Here, we aim to fill this gap. We conduct a comprehensive suite of experiments on a large number of datasets with heterogeneous data and realistic missingness conditions, comparing both novel deep learning approaches and classical ML imputation methods when either only test or train and test data are affected by missing data. Each imputation method is evaluated regarding the imputation quality and the impact imputation has on a downstream ML task. Our results provide valuable insights into the performance of a variety of imputation methods under realistic conditions. We hope that our results help researchers and engineers to guide their data preprocessing method selection for automated data quality improvement.

Arbeitspapiere

GCA Working Paper II – Driving Forces of Green Shopping Behavior [Eng.]

In unserer zweiten Veröffentlichung beschäftigt sich Robin Jadkowski mit psychologischen Determinanten, die zu umweltfreundlicheren Kaufentscheidungen führen. Dabei wird zum einen eine Methode erarbeitet, die Daten aus dem User Tracking unseres GCA mit Umfragedaten abgleicht und zum anderen die Beziehung unterschiedlicher Variablen zueinander untersucht, welche als Triebkraft für umweltfreundliches Verhalten dienen könnten.

Abstract

This study evaluates psychological and socio-demographic driving forces of pro-environmental behavior (PEB) in an online shopping environment. Previous empirical studies substantiate the role and strengths of numerous psychological driving forces that influence individual PEB. However, the type of PEB operationalization is heterogenous, as well as the type and operationalization of the driving forces. Steg & Vlek (2009) stress the point that effective interventions have to be aimed at these driving forces and that the strengths and relationship differs for specific types of PEB. Up to date, studies that use actual behavior as operationalizations of PEB in online shopping environments are rare, therefore this study pursued two main goals: (1) Test a method to link user tracking data of a digital shopping assistant (as indicators for pro-environmental shopping decisions) with self-reported survey items; (2) Exploratively assess the relationship of four socio-demographic and 14 psychological variables that may act as driving forces for PEB. The click behavior of N = 35 beta users of an online shopping assistant was tracked over a period of five months and successfully linked to previously obtained survey data. It was not possible to reliably detect effects of the assessed driving forces – PEB relationship with the achieved sample size. In conclusion, this studies procedure revealed great potential for future research to evaluate the effects of psychological variables on PEB in a real shopping environment.

GCA Working Paper I – Scaling Sustainability Advice [Eng.]

Wir freuen uns, an dieser Stelle das erste Arbeitspapier des Projekts Green Consumption Assistant veröffentlichen zu können. Unsere Kollegin Cathérine Lehmann fasst in diesem unsere Entscheidungswege zu nachhaltigen Produktempfehlungen, sowie mögliche Ansätze zur Skalierung zusammen.

Abstract

Data availability on the sustainability of products is low which poses challenges for actors from all sectors dealing with promoting sustainable consumption. We describe how we currently provide users of a Chrome browser extension with general sustainability advice and with recommendations of best-in-class products in terms of sustainability. Then we outline a possible concept towards more automatisation and thus scalability of the current approach. For the latter, we discuss six different schemes for generating large-scale green recommendations on a product level, finding that currently product sustainability can be best evaluated in terms of data availability when resorting to lists of labelled products. In the future, Product Environmental Footprints and similar data should be more easily available in order to have quantifiable data for research and for showing more information to users. Overall, an integrated approach, including e.g. aspects of  organizational sustainability, might help to fill data voids and/or to provide a more complete picture of a product’s sustainability level.

Blogbeiträge

KI-Berlin

03.06.2021 Article in KI-Berlin Blog [Engl.]

In the article titled „Using Artificial Intelligence to make more sustainable behaviour easy for people” #KI-Berlin introduces the GCA to the broader public and describes how our first iteration works.

Interviews

18.02.2021 Interview über das Projektvorhaben bei RESET

Das Nachhaltigkeitsmagazin RESET — Digital for Good führte ein Interview mit Projektleiter Ruben Korenke und berichtet ausführlich über unser Projektvorhaben sowie die erste Beta-Version des Assistenten.