Echo Blog

江湖无名安心练剑

java-diff-utils 文件差异对比工具包简介
差异举一个最常见的例子，我们使用git进行提交时，通常会使用 git diff --cached 来查看这次提交做了哪些改动，这里我们先简单定义一下什么是diff： diff就是目标文本和源文本之间的区别，也就是将源文本变成目标文本所需要的操作。差异算法在 Git 中，有四种diff算法，分别是Myers、Minimal、Patience和Histogram，它们用于获取位于两...
2022-08-12 01:22:02 | Tool

java big file sort 超大文件如何实现排序？外归并排序（External merge sort）
大文件排序 http://en.wikipedia.org/wiki/Merge_sort http://en.wikipedia.org/wiki/External_sorting 外排序通常来说，外排序处理的数据不能一次装入内存，只能放在读写较慢的外存储器（通常是硬盘）上。外排序通常采用的是一种“排序-归并”的策略。在排序阶段，先读入能放在内存中的数据量，将其排序输出到...
2022-08-12 01:22:02 | Tool

How different are different diff algorithms in Git? GIT 中的差异对比算法介绍
概要自动识别文件的两个版本之间的差异是采矿代码存储库的几个应用程序中的常见和基本任务。 GIT是一种版本控制系统，具有差异实用程序，用户可以选择从默认算法Myers到高级直方图算法的差异算法。从我们的系统映射中，我们在最近的研究中确定了DIFF的三个流行应用。关于14个Java项目中代码流失指标的影响，我们根据不同的差异算法获得了1.7％至8.2％的不同值。关于错误引入的变...
2022-08-12 01:22:02 | Tool

大文件的排序及差异对比？算法介绍及 java 实现
业务需求其他部门提供一个全量的文件。每天都会按照日期新生成一个实体标注标签文件，如 entity_tag_20220801.txt。其中 20220801 是每一天的生成日期。 V1 基本思路直接遍历全量的文件。发现性能比较差，要跑很久才能完成。 V2 多线程使用多线程性能基本可以接受，但是数据库压力还是比较大的。 V3 文件差异结合业务，其实一般情况下，实...
2022-08-12 01:22:02 | Tool

类似滴滴这种打车平台软件会消亡吗？
中间平台商雁过拔毛以前打车的时候，支付给司机的时候，司机问了一下我支付的金额。 “40 元” “MD，到我这里扣了这么多。” “是的，平台会抽成的，一般 30% 以上。” 平台在生活中大家已经习以为常了。比如直播打赏平台抽成 50%，ios 充值提成 40%。类似的美团/饿了吗商家入驻，提成 28%+。这些平台一旦建成之后，就可以凭借着垄断，躺着挣钱。但是最近...
2022-08-12 01:22:02 | Note

贷款计算器算法实现
说明房车这种大件物品购买时，用户一般会采用贷款的方式。一般贷款就需要理解一下对应的计算金额，看一下哪一种更加适合自己。算法介绍银行贷款主要有两种计算方式。等额本息法简介：等额本息法最重要的一个特点是每月的还款额相同，从本质上来说是本金所占比例逐月递增，利息所占比例逐月递减，月还款数不变，即在月供“本金与利息”的分配比例中。前半段时期所还的利息比例大、本金比例小，还...
2022-07-22 01:22:02 | Tool

Netty 源码学习-02-ServerBootstrap 服务端引导类
服务端启动 netty 版本不同版本的 Netty 实现可能会略有差异，此处版本为： <dependency> <groupId>io.netty</groupId> <artifactId>netty-all</artifactId> <version>4.1.17.Final</...
2022-07-22 01:22:02 | Netty

Netty 源码学习-02-server start 服务端启动
服务端启动 netty 版本不同版本的 Netty 实现可能会略有差异，此处版本为： <dependency> <groupId>io.netty</groupId> <artifactId>netty-all</artifactId> <version>4.1.17.Final</...
2022-07-22 01:22:02 | Netty