本发明涉及大数据技术领域,特别是涉及一种银行流水数据的分析方法。
背景技术:
银行流水是真实存在的银行转账记录,但是往来款、借还款、异常交易、关联交易等占较大比例,无法真实反映企业的经营情况,本发明提出的银行流水自动分析系统通过多维数据分析,将流水进行分类,筛查出真实有效的企业经营数据,为企业授信额度提供强有力的数据支撑。
目前市面上的银行流水分析系统只是对银行流水数据进行透视分析,仅对采集到的银行流水数据进行简单分类。经过测试发现,这类分析系统中采用的数据类型单一,分析结果的准确性较差,因此无法真实科学反映企业的经营情况。
技术实现要素:
本发明要解决的技术问题是提供一种银行流水数据的分析方法,能够全面、准确的对企业经营状况进行分析。
为解决上述技术问题,本发明提供了一种银行流水数据的分析方法,所述方法包括:获取企业经营过程中产生的银行流水数据;从银行流水数据中,分别识别经营性流水、筹资性流水、投资性流水、往来款、异常交易、关联交易;对往来款、异常交易及关联交易从企业经营的银行流水数据中剔除;根据剔除往来款、异常交易、关联交易后的银行流水数据,全程自动分析企业的经营状况。
在一些实施方式中,获取企业经营过程中产生的银行流水数据,包括:由企业的多个不同账户,获取企业经营的银行流水数据。
在一些实施方式中,获取企业经营过程中产生的银行流水数据,还包括:在由企业的多个不同账户,获取企业经营的银行流水数据之后,对相同银行账户不同时间的银行流水数据进行拼接;通过关键字匹配技术抽出相同的六个关键字段,其中,关键字段包括:交易时间、对方户名、贷方发生额、借方发生额、余额、摘要。
在一些实施方式中,从银行流水数据中,分别识别经营性流水、筹资性流水、投资性流水、往来款、异常交易、关联交易,包括:根据企业关联名单,以对方户名为索引,筛选出关联交易;根据交易金额和频率、交易时间、是否退款重付等特征,筛选出异常交易,筛选出异常交易,异常交易包括:高额巨额转账、非工作时间对公转账、退款重付;根据交易特征及摘要信息与关键词的匹配结果,筛选出往来款。
在一些实施方式中,根据清除往来款、异常交易、关联交易后的银行流水数据,全程自动分析企业的经营状况,包括:在交易时间维度上,对企业经营状况进行统计。
在一些实施方式中,根据清除往来款、异常交易、关联交易后的银行流水数据,全程自动分析企业的经营状况,还包括:根据银行流水数据,进行经营费用的波动分析;根据银行流水数据,进行企业员工的工资分析。
在一些实施方式中,进行企业员工的工资分析,包括:将企业员工的工资分析结果,与各省统计局公布的工资统计数据进行对比。
在一些实施方式中,对企业经营状况的统计包括:日均余额的统计,以及前十大对手方的统计。
在一些实施方式中,前十大对手方的统计包括:资金流出的统计,以及资金流入的统计。
采用这样的设计后,本发明至少具有以下优点:
本发明可以消除银行流水数据中出现的与往来款、异常交易、关联交易相关的流水数据对最终分析结果的不利影响,更加真实科学的反应企业的经营情况。
附图说明
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
图1是本发明提供的银行流水数据的数据项结构示意图;
图2是本发明提供的银行流水数据的分析方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1示出了本发明提供的银行流水数据的中各个不同的数据项。参见图1,银行流水数据包括:分别来自四大银行、各个商业银行以及各个不同的城商银行的,与该企业有关的银行流水数据。
需要特别指出的是,本系统兼容各种不同格式的银行流水数据。因而,无论流水数据的数据源来自哪家银行,本系统均可以做到兼容。
通过对来自不同数据源的银行流水数据的筛查、汇整,由不同格式的流水数据中识别出银行流水数据中的关键字段。参见图1,这些关键字段可以有:交易时间、对方户名、贷方发生额、借方发生额、余额、摘要等等。
通过对以上描述的各个关键字段中数据特征的进一步分析,可以将银行流水数据区分为六大类。这六大类分别有:经营性流水、筹资性流水、投资性流水、关联交易、往来款、异常交易。
通过对特征的分析,识别六大类流水数据,最为典型的案例是通过对摘要数据的特征识别往来款项。因为,往来款项的流水数据在摘要中均有明确的说明。
由于本发明提供的银行流水书的分析方法在分析过程中,对六大类流水数据分别进行分类区别,因而根据这样的区分类别的流水数据进行分析而得到的经营状况分析结果更为全面和准确。
另外,在六大类流水数据中,有一些类别的流水数据,如果不进行特殊处理,对最终的分析结果会有不利影响。例如,异常交易,由于其本身的数据特性,在分析过程中不应该被考虑进来。类似的类别还包括:往来款和关联交易。
由于在分析过程中对于异常交易、往来款和关联交易进行了清除处理,对最终的分析结果不再有不利影响数据分析 银行,所以,经营状况的分析结果更加准确。
本系统具有较高的兼容性。一家企业有多个银行账户,每个账户功能不同。若单纯分析一个账户,数据太片面。本系统支持一家企业多账户,不同银行流水可同时统一分析,可自动调整不同银行的流水格式,同一时间段各个账户数据进行汇整分析,且本系统全程自动化,一提交报告就可自动生成完整的分析报告。
本系统分析数据具有全面性和准确性。将银行流水数据分为六大类+两统计,六大类包括经营性流水、筹资性流水、投资性流水、往来款、异常交易、关联交易。两统计是日均余额的统计,以及前十大对手方(包含流入/流出)。此处,对手方是指交易中的对方。
其中经营性流水流入明细分为销售回款,营业外收入,其他。经营性流水流出明细分为采购款、薪酬、水电燃气、租金、税费、其他。
薪酬部分结合企业所在地区工资水平进行分析比较,水电燃气则在时间维度上进行分析是否有较大波动,这两部分可较大反映企业是否正常运营。
筹资性流水模块统计出企业的负债比例,可充分反映企业的负债情况。增加各大类金融机构名单进行匹配,保证数据的准确性。
关联交易包括股东、股东对外投资企业、企业对外投资、董监高、董监高对外投资企业关联方等交易。关联交易流水占据流水的比重较大,存在虚假交易的概率也大,因此本系统将其独立成一块。
关联交易主要涉及企业法人及董监高所关联的公司。针对每家企业,系统会自动生成关联企业名单,对方户名与关联企业名单进行对比。
异常交易通过转错退款,非工作时间对公交易,高频且大额(非前十大供应商)交易,长期未发生交易的账户突然有大额资金进入等维度进行筛查。高频:日均笔数的30%以上。大额:月均收入的15%以上。
本系统可以提供流入/流出比例,经营流水明细及比例,负债率,净流入,日均余额等数据,可以全面真实反映企业经营情况。
企业上传银行流水到系统后,系统开始对银行流水文档(xls或xlsx格式)进行读取,相同账户不同时间的流水进行数据拼接,不同银行之间的流水文档格式差异较大,系统通过关键字匹配技术抽出相同的六个字段:1.交易时间2.对方户名3.贷方发生额4.借方发生额5.余额6.摘要。其中交易时间字段由交易时间,交易日期或日期等字段抽成包含日期和时间的字段;对方户名字段由对方账号户名、对方户名、对方名称等统一命名;贷方发生额字段由贷方发生额、收入等字段统一命名;借方发生额字段由借方发生额、支出等字段统一命名;余额字段由账户余额、余额、交易余额等统一命名;摘要字段由摘要、附言、交易信息、交易用途、备注等统一命名。
交易时间维度上分析企业经营情况,其中经营性交易及日均余额/最小余额从金额-时间关系进行统计。对方户名用于前十大对手方及各个模块的交易明细统计,且关联交易、筹资性交易中的类金融机构/银行从对方户名中匹配。贷方发生额、借方发生额、余额可从各模块流入/流出及金额占比情况进行统计。大部分的交易分类都是通过摘要信息中的关键字进行匹配,主要包括工资、租金、货款、水电气、税费,手续费,利息等。
每个模块之间会有交叉重叠的部分,例如一笔交易可能同时属于关联交易、异常交易、往来款等,因此数据的分析顺序与数据筛选逻辑对于最终分析结果及运行速度影响较大,本系统对数据分析逻辑进行重点设计。本系统以容易被打散的数据及抽离清晰度高数据优先抽离。第一,采用数据透视表,以对方户名为索引,筛选出关联交易,这类数据准确性高。第二,异常交易中
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。