Newsroom

데이터 수집의 무한굴레에서 벗어나기 - 데이터 검토와 실전 체크리스트

2025.04.23탄소중립연구원Editor 유현서
ChatGPT를 이용하여 생성, 저자 수정

데이터 수집은 ‘ 정보력’‘논리’ 의 싸움입니다. 둘은 상호 보완 관계에 있어요.

지난 글에서는 LCA의 과정 중 데이터 수집 방법을 다루었습니다. 어떤 데이터를 수집해야 하며, 그 과정에서의 실무 팁 3가지를 긴 글에 걸쳐 말씀드렸어요.

지난 글에서 드렸던 이야기가 데이터 수집을 위한 ‘정보력’ 과 관련된 부분이었다면,
이번 글과 다음 글에 걸쳐 전해드릴 이야기는 데이터 수집을 보완하고 완성하는 ‘논리’ 에 대한 부분입니다.

모두가 완벽한 데이터를 구할 수는 없잖아요. 저 또한 LCA를 수행하는 과정에서 필요한 데이터를 원스톱으로 얻어본 적은 단 한 번도 없었습니다. 설령 데이터를 구했더라도 오차나 누락이 없는지 검토를 거치다 보면, 포함되어야 할 데이터가 없다는 사실을 발견하기도 해요.

이번 글에서는 ‘데이터의 검토’ 를 다룹니다. 데이터의 보완을 논하기 전에, 부족한 데이터가 있는지 찾아내는 방법을 먼저 전해드리려 해요. 아래의 내용을 담았습니다.

  • 수집된 데이터에 중복이나 누락이 없음을 확인하는 방법 에는 어떤 것이 있나요? 💦
  • 데이터 검토 시, 어떤 것들을 확인 해야 할까요? ✅

당장의 프로젝트에 활용 가능하도록, 이론 너머 실전에서의 내용을 담았습니다. 데이터 검토 시 잊지 않고 확인해야 할 5가지의 ‘ 데이터 검토 체크리스트 ’도 함께 준비했어요. 필요하실 때 언제든 꺼내어 보는 글이 되기를 바랍니다. 😉


데이터 검토의 기본, 물질 수지를 잡아라 🏹

‘제3자 검증’은 LCA 프로젝트 말미에 늘 언급되는 사항입니다.

LCA를 수행한 당사자도 자체적인 검토를 하겠지만, 이것만으로는 결과의 독립성을 보장하기 어려우며 자칫하면 편향된 결과로 이어질 수 있어요. 따라서 독립성을 보장할 수 있는 제3자 기관에 검증을 요청하면, 해당 기관에서 판단 후 ‘이 LCA는 국제 표준에 따른 절차로 진행된 것 맞아’하고 의견서를 제시하는 절차가 별도로 존재합니다. 이를 제3자 검증 이라 불러요.

이 글을 읽고 계신 많은 분들께서 LCA 프로젝트 수행 시, 제3자 검증을 염두에 두고 있으실 것이라 생각됩니다. 물질 수지(Mass balance) 검토는 제3자 검증 시 필수적으로 확인을 거치는 가장 기본이 되는 영역 중 하나입니다.

LCA 국제 표준인 ISO 14044:2006에서도 데이터의 확인(validation) 방법에 있어서 물질 수지를 언급하고 있어요. 그 원리는 간단합니다.

저자 제작

질량 보존의 법칙에 의해, 각 단위공정에서 투입물과 산출물의 총 질량이 동일 한지 확인하면 됩니다.

개별 단위공정의 물질 수지가 맞고 각 단위공정에서 산출되는 제품 흐름에 이상이 없이 연결하였다면, 각 단위공정을 연결한 전체 공장에서의 물질 수지도 맞게 됩니다.

…여기까지가 LCA 교과서에 수록될 법한 내용입니다. 안타깝게도, 실제 상황에서는 거의 모든 경우 수집한 데이터의 물질 수지가 맞지 않아요.

원인은 여러가지입니다. 가장 먼저 누락된 데이터가 존재할 가능성이 높고, 그 외에도

  • 상이한 데이터 출처 를 활용하였거나

    ex. 투입물은 구매 데이터, 산출물은 ERP 데이터
  • 데이터의 가공 방식 에 차이가 있거나

    ex. 가중평균 데이터 vs 산술평균 데이터
  • 눈에 보이지 않는 물질 손실 이 발생하는 등

    ex. 기화, 탈루, 분진 날림, …

짜여진 실험실이 아닌 이상 현실에서는 통제하기 어려운 변수가 너무도 많습니다.
우리의 목표는 보유하고 있는 데이터로 최대한의 정확도를 얻어내는 것이니까요, 어느 정도는 오차를 받아들이고 이를 보완할 계획을 세우는 것이 좋습니다.

우선 오차율을 계산해보고, 물질 수지에 차이가 발생할 만한 요인을 모두 나열해보세요. 오차율이 납득 가능할 만한 범위를 벗어난다면, 잘못 기입되거나 누락된 데이터가 없는지 다시 찾아보아야 합니다.

저자 제작, OpenArt를 활용하여 생성된 이미지 활용

따로 측정하지 않고 있던 사소한 수준의 폐기물 등이 원인으로 추정된다면(ex. 공정 손실, 분진 등), 해당 항목을 산출물로서 추가하여 물질 수지를 보정 해주는 방법이 있습니다.

저자 제작, OpenArt를 활용하여 생성된 이미지 활용

또는 손실 그 자체를 자연스러운 것으로 받아들이고 현재의 물질 수지를 유지하되, 해당 내용을 제한사항에 남겨 오차 요인을 언급 하는 방법도 있겠죠.

저자 제작, OpenArt를 활용하여 생성된 이미지 활용

물론 가장 좋은 방법은 근거에 기반한 데이터를 보충하는 것입니다. 반드시 정량적인 측정값이 아니더라도 괜찮아요.

참고로, ISO 14044:2006에서는 물질 수지와 함께 에너지 수지(Energy balance) 에 대한 내용을 명시하고 있습니다.

저자 제작

기본 개념은 물질 수지와 동일하지만, 에너지 수지는 물질 수지에 비해 쉽게 활용되지는 못합니다. 질량은 보존되고 측정 가능하지만, 에너지는 늘 손실되고 측정하기도 어렵거든요. 발열량, 효율 등의 추가 지표가 필요하고, 주로 보일러나 스팀 등 에너지원에 대하여 활용 가능합니다.

지난 글 에서부터, 데이터 수집의 최종 목표는 ‘중복이나 누락 없이, 전경 시스템의 투입물과 산출물을 구하는 것’ 이라 말씀드렸어요.

물질 수지는 이러한 데이터 수집 목표의 달성 정도를 정량적으로 표현한 지표 라고도 할 수 있습니다.

물질 수지를 데이터 검토 방법으로서 소개했지만, 꼭 물질 수지 검토를 데이터 수집의 말미에 진행할 필요는 없습니다. 정말로 막판 검토용으로 확인할 수도 있고, 그때그때 부족한 정보를 요청할 수 있도록 각 단위공정별로 데이터를 수집할 때마다 확인할 수도 있어요.

탄중연의 LynC는 후자의 방식을 제공하는데요, 누락 등의 오차를 곧바로 점검할 수 있도록 물질 수지를 실시간으로 확인 하실 수 있습니다.

LynC 시스템 화면, ⓒ 탄소중립연구원
더 자세한 내용이 궁금하다면 - 잘 아시죠? ( ͡° ͜ʖ ͡°) 무료 데모를 신청해주세요 🙆


데이터 무한굴레 그만 🤦‍♀️ 5가지 데이터 검토 체크리스트

데이터 수집을 담당하였다면, 반드시 확인하고 넘어가야 할 5가지 데이터 검토 체크리스트 를 소개합니다.

제가 LCA를 수행할 때 늘 확인하던 사항이기도 한데요, 이 5가지만 확실히 하더라도 데이터 수집의 무한굴레를 효과적으로 벗어날 수 있습니다. 데이터 문제로 건너편 부서와 여러 번 전화를 주고받을 일도, 제3자 검증 시 증빙자료를 찾아 정보의 바다를 헤맬 일도 현저히 줄일 수 있어요.

  • 물질 수지 / 에너지 수지가 맞는가?
  • 수집된 데이터의 단위가 정확한가? (feat. 밀도, 발열량)
  • 활용된 값의 산정 방식과 출처를 확보하고 있는가?
  • 투입물 / 산출물 각각이 나타내는 물질이 명확한가?
  • 제품시스템의 범위에 있음에도 누락된 공정은 없는가?

물질 수지와 에너지 수지에 대해서는 위에서 설명했으니, 나머지 사항들을 몇 가지 팁과 함께 소개할게요.

수집된 데이터의 단위가 정확한가?

“당연한 것 아냐?”하고 생각하실 수 있지만, ❗ 정말로❗ 실수가 잦기 때문에 강조하고 싶은 부분입니다. 물질 수지 확인 결과 오차율이 127%, 269%에 달하는 ‘말도 안 되는’ 결과가 나타났다면, 기입한 값과 그 단위를 의심해보세요. 데이터 수집 템플릿을 채우는 과정에서 단위를 고려하지 않고 값을 기입했을 수도 있고, 수집된 값의 단위를 환산하는 과정에서 오류가 발생했을 수도 있습니다.

특히 단위 환산 시, 사용한 밀도, 발열량 등 환산계수의 출처 를 남기는 것을 잊지 말아야 해요. 환산계수를 제공하는 기관마다 서로 다른 값을 제시하기 때문에, 제품시스템의 상황(제품 생산 국가, 생산 시기 등)을 고려한 설득력 있는 값을 활용하는 것이 좋습니다.

한 가지 팁을 공유해요. 🍯 주로 사용하는 에너지원의 경우, 다음과 같은 자료를 활용할 수 있습니다.

사용하는 물질의 상(기체, 액체 등)을 고려해 적절한 단위와 환산계수가 도입되었는지 확인해주세요!

활용된 값의 산정 방식과 출처를 확보하고 있는가?

사용한 데이터의 출처는 LCA 결과의 타당성과 신뢰성을 크게 좌우합니다. 그렇기에 제3자 검증 시에도 중요하게 확인하는 부분이기도 합니다. “반드시 이 데이터를 써야 해”라는 꽉 막힌 조건은 없지만, 활용한 데이터와 그 가공 방식이 타당하며 최선의 방식임을 충분히 납득시킬 수 있어야 해요. 그리고 그 출처와 산정 방식을 확보하고 있어야 내년, 내후년에 LCA를 할 때 산정 방식의 변화로 인해 값이 널뛰는 현상을 막을 수 있습니다.

가능하다면 가공된 자료뿐만 아니라, 원본이 되는 자료를 함께 보관 하는 것을 추천드립니다. 그 원본이 되는 자료가 어떻게 수집되었는지도 이해한다면 오차 요인을 파악하는 데에 도움이 됩니다.

LynC 시스템 화면, ⓒ 탄소중립연구원

투입물 / 산출물 각각이 나타내는 물질이 명확한가?

이때 ‘명확하다’의 기준이 궁금하실 것 같아요. 쉽게 말해 업스트림 / 다운스트림 DB를 연결할 수 있을 정도의 정보 를 갖추는 것이 좋습니다. 구체적인 기준은 확보 가능한 업스트림 / 다운스트림 DB에 따라 다릅니다.

예를 들어, 공장에서 나오는 Purge gas가 대기 중으로 배출되는 상황을 봅시다. 보통은 LCI DB에 Purge gas에 대한 정보가 직접적으로 존재하지는 않습니다. 배출 공정과 용도에 따라 Purge gas의 조성이 다르기 때문이에요.
따라서 이 경우, 공장에서 관리되는 Purge gas의 평균 조성 등을 이용하여 ‘N₂ 4Nm³, CO₂ 1Nm³’과 같이 산출물을 나누어 적어주어야 추후 전과정 영향평가 (구한 투입물과 배출물을 잠재적 환경영향으로 변환하는 단계) 과정에서 필요한 결과를 도출할 수 있습니다.

저자 제작

제품시스템의 범위에 있음에도 누락된 공정은 없는가?

외부 위탁 생산인 줄 알았는데 알고 보니 내부 시설에서 자체적으로 생산이 이루어지고 있었던 경우 등에 해당됩니다. 내부에서 관리되는 공정도 를 확인해보거나, 공장을 가장 잘 이해하고 있는 생산 담당자를 인터뷰 하는 것도 도움이 되는 방법입니다. 지난 글에서 언급하였듯 온실가스 명세서를 매년 발행하는 기업이라면, 명세서에 제시된 조직경계 를 확인하여 거시적인 규모에서 공정 누락 유무를 파악할 수 있습니다.


지금까지 LCA에서 데이터 검토 방법 인 물질 수지와 함께 주요 검토 확인사항을 소개하였습니다. 다음 사항을 기억해주시면 좋을 것 같아요.

  • 물질 수지와 에너지 수지데이터 수집의 완결성을 정량적으로 나타내는 지표 이다.
  • 데이터를 검토하는 과정에서는 단위, 출처 등 정량적인 숫자 이외의 사항에 대해서도 점검이 필요하다.

물질 수지를 비롯한 데이터 검토는, 데이터 수집에 있어서 내가 보완해야 할 구멍을 찾아내는 과정이라 할 수 있습니다. 이번 글에서 소개한 데이터 검토 체크리스트로, 데이터 수집과 검증 과정에서 발생하는 수많은 시행착오를 줄일 수 있기를 바랍니다.

서두에서 데이터 수집은 정보력과 논리의 싸움이라 말씀드렸어요. 검토를 거쳐 찾은 구멍은 정보력을 동원하여 메울 수도 있고, 혹은 적당한 가정 등을 도입해 논리로써 보완할 수도 있습니다.

다음 글에서는, 비어 있는 데이터를 보완하기 위한 LCA에서의 논리를 주제로 찾아뵙겠습니다. 💫