大数据_上海站长网

大数据时代必不可少的大数据分析和制作工具大全

所属栏目：[大数据] 日期：2020-12-25 热度：200

1.微信大数据分析工具新媒体指数：http://www.gsdata.cn 2.数据可视化工具百度ECharts：http://echarts.baidu.com/ Cytoscape：http://www.cytoscape.org/ 图表秀：http://www.tubiaoxiu.com/ 数据观：http://shujuguan.cn/ 微博足迹可视化：http://vis.pk[详细]
A+B Problem II 大数加法

所属栏目：[大数据] 日期：2020-12-25 热度：77

A+B Problem II http://acm.nyist.net/JudgeOnline/problem.php?pid=103 时间限制：3000?ms ?|? 内存限制：65535?KB 难度：3 输入 The first line of the input contains an integer T(1=T=20) which means the number of test cases. Then T lines follow,e[详细]
NBA篮球运动员大数据分析决策支持系统

所属栏目：[大数据] 日期：2020-12-25 热度：191

package com.dt.spark.sparksql import org.apache.hadoop.conf.Configuration import org.apache.hadoop.fs.{FileSystem,Path} import org.apache.spark.SparkConf import org.apache.spark.sql.SparkSession /** ? * NBA篮球运动员大数据分析决策支持系统[详细]
条条大道通罗马：大数据分析工具的十条学习路径

所属栏目：[大数据] 日期：2020-12-25 热度：88

来自：IT经理网（微信号：ctociocom）链接：www.ctocio.com/hotnews/22900.html （点击尾部阅读原文前往）虽然只有极少数人能够修炼成数据科学家这一21世纪最性感多金专业人士，但对于大多数非数据分析专业的IT人士来说，掌握对路的大数据工具同样意味着加[详细]
某种序列-大数计算

所属栏目：[大数据] 日期：2020-12-25 热度：171

某种序列 http://acm.nyist.net/JudgeOnline/problem.php?pid=114 时间限制：3000?ms ?|? 内存限制：65535?KB 难度：4 输入输入包含多行数据? 每行数据包含3个整数A0,A1,A2 (0 = A0,A2 = 100000000)? 数据以EOF结束输出对于输入的每一行输出A99的值样例[详细]
视音频数据处理入门：UDP-RTP协议解析

所属栏目：[大数据] 日期：2020-12-25 热度：120

http://blog.csdn.net/leixiaohua1020/article/details/50535230[详细]
数据挖掘中的模式发现（八）轨迹模式挖掘、空间模式挖掘

所属栏目：[大数据] 日期：2020-12-25 热度：99

这是模式挖掘、数据挖掘的一部分应用。空间模式挖掘(Mining Spatiotemporal Patterns) 两个空间实体之间存在若干拓扑关系，这些关系基于两个实体的位置：分离相交包含如图所示地表示位置信息，可以提取类似下面的规则： i s _ a ( x , l a r g e _ t o[详细]
企业BI系统应用的切入点及五大策略

所属栏目：[大数据] 日期：2020-12-25 热度：177

从技术的角度来看，BI的技术正在走向成熟，处于一个发展的阶段，但它促使了BI的应用在成本方面开始逐步的降低，越来越多的企业在BI应用方面取得了成功。从实施的角度来出发，实施商业智能系统是一项复杂的系统工程，整个项目涉及企业管理，运作管理，信息系[详细]
挖掘隐式启动Activity可能存在的坑

所属栏目：[大数据] 日期：2020-12-25 热度：184

今日科技快讯很早之前，谷歌母公司Alphabet的董事长施密特就曾经表示，在中国市场，谷歌需要寻找到一个商业伙伴来开展自身的一些业务。而近日有消息传出，谷歌和网易正在进行合作磋商，很可能是成立合资公司，在国内推出针对中国市场的Google Play应用商店[详细]
BloomFilter——大规模数据处理利器

所属栏目：[大数据] 日期：2020-12-25 热度：86

原文：http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html 笔记：类似bloombit，用来查找某个东西是否存在，可以允许少量错误率 bloombit 先定义一个bit数组，插入时将数据hash后置位相应的位，查询时看相应的位是否置位，这样会有一定的出错概[详细]
电商如何上了bi的道？

所属栏目：[大数据] 日期：2020-12-25 热度：178

（这就不要跟我提淘宝京东唯品会之类的了，这条道本就是他们趟出来的，以下主要针对垂直电商以及传统零售转电商一类） BI这条道不再新鲜了，但也是有些公司上来了，有些没上来。没上来的可能还不确定什么时机该上，上来的也是各有各的苦衷，家家有本难念的经[详细]
算法训练区间K大数

所属栏目：[大数据] 日期：2020-12-25 热度：176

算法训练区间k大数查询 ? 时间限制：1.0s ? 内存限制：256.0MB ? ? 问题描述给定一个序列，每次询问序列中第l个数到第r个数中第K大的数是哪个。输入格式第一行包含一个数n，表示序列长度。第二行包含n个正整数，表示给定的序列。第三个包含一个正整数m[详细]
[bigdata-34] pyenv + anaconda 4.2 + python3.5+ ubuntu 16.04

所属栏目：[大数据] 日期：2020-12-24 热度：169

1. pyenv 官网 https://github.com/yyuu/pyenv 2. 安装 git clone https://github.com/yyuu/pyenv.git ~/.pyenv echo 'export PYENV_ROOT="$HOME/.pyenv"' ~/.bashrc echo 'export PATH="$PYENV_ROOT/bin:$PATH"' ~/.bashrc echo 'eval "$(pyenv init -)"' ~[详细]
MPP DB 是大数据实时分析系统

所属栏目：[大数据] 日期：2020-12-24 热度：131

大数据领域，实时分析系统（在线查询）是最常见的一种场景，前面写了一个《实时分析系统 (HIVE/HBASE/IMPALA) 浅析》讨论业界当前常见的方案。互联网公司用得比较多是 HIVE/HBASE ，如腾讯基于 HIVE 深度定制改造，改名为 TDW ，小米等公司选用 HBASE 等。[详细]
BI学习计划

所属栏目：[大数据] 日期：2020-12-24 热度：139

1??????????《数据仓库》——比尔.恩门，主要介绍什么是数据仓库 2??????????SSIS设计与开发 2.1?????????BIWORK的微软SSIS系列 2.2?????????微软MSDN之SSIS系列 3??????????SSAS设计与开发 3.1?????????BIWORK的微软SSIS系列 3.2?????????微软MSDN之SSIS系[详细]
BI导论——数据仓库概论

所属栏目：[大数据] 日期：2020-12-24 热度：173

1??????????书名《Building the Data WareHouse》作者：比尔.恩门 2??????????目的：将积累的数据变成信息，以建立决策支持系统（DSS） 3??????????原有的DSS是分裂的，按需抽取的，导致重复与低效 4??????????原始数据与DSS数据对比与差异 4.1?????????原始[详细]
[bigdata-035]用js dtree展示一个树形结构 py3+dtree+jquery

所属栏目：[大数据] 日期：2020-12-24 热度：80

1. dtree的下载 http://destroydrop.com/javascripts/tree/default.htm 2. 目录结构 . ├── static │?? ├── css │?? │?? └── dtree.css │?? ├── img │?? │?? ├── base.gif │?? │?? ├── cd.gif │?? │?? ├── diffDoc.gif │??[详细]
[编程题]数字翻转(大数加法)

所属栏目：[大数据] 日期：2020-12-24 热度：123

对于一个整数X，定义操作rev(X)为将X按数位翻转过来，并且去除掉前导0。例如: 如果 X = 123，则rev(X) = 321; 如果 X = 100，则rev(X) = 1. 现在给出整数x和y,要求rev(rev(x) + rev(y))为多少？? 输入描述: 输入为一行，x、y(1 ≤ x、y ≤ 1000)，以空格隔开[详细]
[bigdata-036] mit-scheme试用

所属栏目：[大数据] 日期：2020-12-24 热度：157

1. 安装Mit-scheme apt-get install mit-scheme 2. 写一个hello wold代码， hi.scm (begin (display "Hello,World!") (newline)) 3. 在命令行执行 scheme，进入交互界面，然后输入命令 (load 'hi.scm') 将执行这个文件，然后输出 "Hello,World!" 4. scheme语[详细]
[bigdata-037] docker hue 用SQL获取数据以及可视化

所属栏目：[大数据] 日期：2020-12-24 热度：122

1. hue官网 https://github.com/cloudera/hue http://gethue.com/ 2. hue的功能有py2+django开发，提供Hive,Impala,MySQL,Oracle,PostgreSQL,Spark SQL,Solr SQL,Phoenix...等SQL数据获取和页面展示 3. 用docker 安装hue docker pull gethue/hue 4. hue ima[详细]
[bigdata-037]apache hue 用SQL获取数据以及可视化

所属栏目：[大数据] 日期：2020-12-24 热度：98

1. hue官网 https://github.com/cloudera/hue http://gethue.com/ 2. hue的功能有py2+django开发，提供Hive,Impala,MySQL,Oracle,PostgreSQL,Spark SQL,Solr SQL,Phoenix...等SQL数据获取和页面展示 3. 用docker 安装hue docker pull gethue/hue 4. hue ima[详细]
[bigdata-038] tushare 金融数据安装使用

所属栏目：[大数据] 日期：2020-12-24 热度：97

1. 安装 pip install tushare 2. 获取股票的基本面 #!/usr/bin/env python3#!-*- coding:utf-8 -*-import tushare as ts#显示基本信息res = ts.get_stock_basics()print(res)print(type(res)) res是的类型是pandas.core.frame.DataFrame，3114? x 22 的矩阵[详细]
[bigdata-032] 把json文件导入到mongodb

所属栏目：[大数据] 日期：2020-12-24 热度：112

用mongoimport命令 mongoimport -d db1 -c colle1 --type json --file cc.json --host 114.55.66.77 --upsert -u user1 -p passwd1 这个命令，如果同id的记录在，就更新，如果记录id不重复，就插入。因为upsert，所以会比较慢。 mongoimport -d db1 -c colle[详细]
算法题 16：两个大数相乘（华为面试）

所属栏目：[大数据] 日期：2020-12-24 热度：185

题目：请使用代码计算 1234567891011121314151617181920? * 2019181716151413121110987654321 备注：请留言，描述一下解题思路。原题目要求写代码，这里不方便提交。[详细]
常用的相似性度量-各种距离总结

所属栏目：[大数据] 日期：2020-12-24 热度：75

在做分类时常常需要估算不同样本之间的相似性度量(SimilarityMeasurement)，这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究，甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本文目录[详细]

6473

204