月眸—java技术交流,技术分享,资源分享
海量数据处理之Top K问题
在海量数据处理中,经常会遇到的一类问题就是在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常被成为top K问题,例如在搜索引擎中,统计最热门的10的查询词,在歌 【阅读更多...】
海量数据处理之重复问题
在海量数据中查找重复出现的元素或者去除重复元素是经常遇到的大数据领域问题,针对此类问题,可以采用位图法来实现。例如,已知某文件中包含一些电话号码,每个号码为8位数字,统计不同号码的个数。 本题最好的解 【阅读更多...】
JVM加载class文件的原理和机制
java语言是一种具有动态性的解释型语言,类(class)只有加载到JVM中才能运行。当运行指定程序时,JVM会将编译生成的.class文件按照需求和一定的规则加载到内存中,并组织成为一个完整的jav 【阅读更多...】
java中堆和栈的区别
在java语言中,堆和栈都是内存中存放数据的地方,那么他们究竟有啥区别呢。 一、Java中的数据类型 在分析他们的区别之前,我们先来了解一下Java中的数据类型,我们知道java中数据类型分为基本数据 【阅读更多...】
Dos命令格式化磁盘
如果u盘出现损坏,无法在电脑上显示时,我们就需要使用dos命令来进行格式化了。下面是步骤: 一、打开命令行窗口 使用组合键windows+R,在输入栏输入cmd打开命令行窗口 二、输入diskpart 【阅读更多...】
海量数据处理之排序问题
海量数据处理中一类常见的问题就是排序问题,即对海量数据进行排序。例如,一个文件中有9亿条不重复的9位整数,对这个文件中的数字进行排序。 针对这个问题,最容易想到的方法是将所有数据导入内存中,然后使用常 【阅读更多...】
初识红黑树
学过数据结构的人都知道红黑树这个东东,可是一提起它,很多人都头疼,因为太难懂了,特别是那五条性质,还有旋转啊、插入啊、删除啊这些操作。相信没几个人能真正看完的,因为看完之后整个人都不好了。红黑树因为其 【阅读更多...】
Hive简介及安装
一、Hive是什么 hive是基于hadoop的数据仓库。 二、Hive安装 安装Hive的前提是安装了hadoop和Mysql,这里不再赘述 。很简单的,网上教程很多。本文仅演示单机安装。 1、下载 【阅读更多...】
Java学习笔记之HashMap实现原理
一、HashMap的数据结构 HashMap是利用数组和链表/红黑树来实现对数据的存储。 1>数组 数组存储区间是连续的,占用内存严重,故空间复杂的很大。但数组的二分查找时间复杂度小,为O(1) 【阅读更多...】
提高开发效率—Lombok插件
一、Lombok是什么 Lombok能通过注解的方式,在编译时自动为属性生成构造器、getter/setter、equals、hashcode、toString方法。这样我们就不用手动去构建这些代码了 【阅读更多...】