迅闻网
让更多人看到你

mongodb数据基本单位(数据存储的网站叫什么)

  mongodb数据基本单位

MongoDB的文件存储格式为BSON,同JSON相同支撑往其它文档目标和数组中再插入文档目标和数组,同时扩展了JSON的数据类型.与数据库打交道的那些应用。例如,JSON没有日期类型,这会使得处理原本简略的日期问题变得非常繁琐。只要一种数字类型,无法区分浮点数和整数,更不能区分32位和64位数字。也没有办法表明其他常用类型,如正则表达式或函数。
下面是MongoDB的支撑的数据类型:
nullnull用于表明空值或许不存在的字段。{“x”:null}
布尔布尔类型有两个值’true’和’false1′.{“X”:true}
32位整数类型不可用。JavaScript仅支撑64位浮点数,所以32位整数会被自动转化。
64位整数不支撑这个类型。shell会运用一个特别的内嵌文档来显示64位整数,
64位浮点数shell中的数字都是这种类型。下面的表明都是浮点数:{“X”:3.1415926}{“X”:3}
字符串UTF-8字符串都可表明为字符串类型的数据:{“x”:”foobar”}
符号不支撑这种类型。shell将数据库里的符号类型转化成字符串。
目标id目标id是文档的12字节的仅有ID,{“X”:ObjectId()}
日期日期类型存储的是从规范纪元开端的毫秒数。不存储时区:{“X”:newDate()}
正则表达式文档中能够包含正则表达式,选用JavaScript的正则表达式语法:{“x”:/foobar/i}
代码文档中还能够包含JavaScript代码:{“x”:function(){/*……*/}}
二进制数据二进制数据能够由任意字节的串组成。不过shell中无法运用。
最大值BSON包含一个特别类型,表明或许的最大值。shell中没有这个类型。
最小值BSON包含一个特别类型,表明或许的最小值。shell中没有这个类型。
未定义文档中也能够运用未定义类型:{“x”:undefined}
数组值的调集或许列表能够表明成数组:{“x”:[“a”,”b”,”c”]}
内嵌文档文档能够包含别的文档,也能够作为值嵌入到父文档中,数据能够安排得更自然些,不用非得存成扁平结构的:{“x”:{“food”:”noodle”}}
数字
JavaScript中只要一种“数字”类型。因为MongoDB中有3种数字类型(32位整数、64位整数和64位浮点数),shell有必要绕过JavaScript的约束。默许情况下,shell中的数字都被MongoDB作为是双精度数。这意味着如果你从数据库中取得的是一个32位整数,修正文档后,将文档存回数据库的时候,这个整数也被转化成了浮点数,即使保持这个整数原封不动也会这样的。所以明智的做法是尽量不要在shell下覆盖整个文档。
日期
JavaScript的Date目标用做MongoDB的日期类型,创建一个新的Date目标时,通常会调用newData(“”)。

MongoDB

数据存储的网站叫什么

Part1数据查询网站
1企业产生的用户数据
百度指数:http://index.baidu.com/阿里指数:https://alizs.taobao.com/TBI腾讯阅读指数:http://tbi.tencent.com/新浪微博指数:http://data.weibo.com/index2数据渠道购买数据
数据堂:http://www.datatang.com/about/about-us.html国云数据商场:http://www.moojnn.com/data-market/贵阳大数据交易所:http://trade.gbdex.com/trade.web/indexa.jsp3政府/机构揭露的数据
中华人民共和国国家统计局数据:http://data.stats.gov.cn/index.htm国际银行揭露数据:http://data.worldbank.org.cn/联合国数据:http://data.un.org/纳斯达克:http://www.nasdaq.com/zh4数据管理咨询公司
麦肯锡:http://www.mckinsey.com.cn/埃森哲:https://www.accenture.com/cn-zh/艾瑞咨询:http://www.iresearch.com.cn/5国内数据库
中国经济社会大数据研讨渠道:https://data.cnki.netCEIC经济数据库:https://www.ceicdata.com国泰安CSMAR经济金融数据库:https://www.gtafe.com锐思RESSET数据库:http://www.resset.com/浙大卡特-企研中国涉农研讨数据库:http://ccad.qiyandata.com6国外数据库
彭博(Bloomberg)终端WRDS沃顿数据服务渠道:https://wrds-web.wharton.upenn.edu/wrds/含有CRSP,Compustat等数据库FRED美联储经济数据:https://fred.stlouisfed.org/美国宏观经济时间序列数据美联储数据库:https://www.federalreserve.gov/data.htm联邦统计署:http://www.census.gov/美国经济剖析局(BEA):https://www.bea.gov/美国财政部:https://home.treasury.gov/美国商务部:https://data.commerce.gov/BvD系列数据库:https://www.bvdinfo.com/en-gb/含有BankFocus、Osiris、Orbis、Zephyr等数据库美国政府揭露数据:https://www.data.gov/这是美国政府揭露数据的所在地,该站点包括了超越19万的数据点。这些数据集不同于气候、教育、能源、金融和更多领域的数据。印度政府揭露数据:https://data.gov.in/这是印度政府揭露数据的所在地,经过各种职业、气候、医疗保健等来寻觅数据,你可以在这里找到一些灵感。依据你寓居的国家的不同,你也可以从其他一些网站上阅读相似的网站。WorldBank:http://data.worldbank.org/国际银行的敞开数据。该渠道供给OpenDataCatalog,国际发展指数,教育指数等几个东西。RBI:https://rbi.org.in/Scripts/Statistics.aspx印度储藏银行供给的数据。这包括了货币商场操作、收支平衡、银行运用和一些产品的几个目标。Part2大型数据集
AmazonWebService-datasets:https://aws.amazon.com/cn/datasets/Amazon供给了一些大数据集,可以在他们的渠道上运用,也可以在本地核算机上运用。您还可以经过EMR运用EC2和Hadoop来剖析云中的数据。在亚马逊上盛行的数据集包括完好的安定电子邮件数据集,GoogleBooksn-gram,NASANEX数据集,百万歌曲数据集等。Googledatasets:https://cloud.google.com/bigquery/public-data/Google供给了一些数据集作为其BigQuery东西的一部分。包括GitHub公共资料库的数据,HackerNews的一切故事和谈论Youtube-labeled-Video-Dataset:https://research.google.com/youtube8m/Part3猜测建模与机器学习数据集
UC-Machine-Learning-Repository:https://archive.ics.uci.edu/ml/datasets.htmlUCI机器学习库显然是最著名的数据存储库。假如您正在寻觅与机器学习存储库相关的数据集,通常是首选的当地。这些数据集包括了各种各样的数据集,从像Iris和泰坦尼克这样的盛行数据集到最近的奉献,比如空气质量和GPS轨迹。存储库包括超越350个与域名相似的数据集(分类/回归)。您可以运用这些过滤器来确认您需求的数据集。Kaggle:https://www.kaggle.com/datasetsKaggle提出了一个渠道,人们可以奉献数据集,其他社区成员可以投票并运转内核/脚本。他们总共有超越350个数据集——有超越200个特征数据集。尽管一些开始的数据集通常呈现在其他当地,但我在渠道上看到了一些风趣的数据集,而不是在其他当地呈现。与新的数据集一起,界面的另一个优点是,您可以在相同的界面上看到来自社区成员的脚本和问题。Analytics-Vidhya:https://datahack.analyticsvidhya.com/contest/all/您可以从咱们的实践问题和黑客马拉松问题中参加和下载数据集。问题数据集基于真实的职业问题,而且相对较小,因为它们意味着2-7天的黑客马拉松。Quandl:https://www.quandl.com/Quandl经过起网站、API或一些东西的直接集成供给了不同来历的财务、经济和代替数据。他们的数据集分为敞开和付费。一切敞开数据集为免费,但高级数据集需求付费。经过搜索仍然可以在渠道上找到优质数据集。例如,来自印度的证券交易所数据是免费的。PastKDDCups:http://www.kdd.org/kdd-cupKDDCup是ACMSpecialInterestGroup组织的年度数据发掘和知识发现竞赛。Part4图画分类数据集
TheMNISTDatabase:http://yann.lecun.com/exdb/mnist/最盛行的图画识别数据集,运用手写数字。它包括6万个示例和1万个示例的测验集。这通常是第一个进行图画识别的数据集。Chars74K:http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/这里是下一阶段的进化,假如你现现已过了手写的数字。该数据集包括天然图画中的字符识别。数据集包括74,000个图画,因此数据集的名称。FrontalFaceImages:http://vasc.ri.cmu.edu//idb/html/face/frontal_images/index.html假如你现已完成了前两个项目,而且可以识别数字和字符,这是图画识别中的下一个挑战等级——正面人脸图画。这些图画是由CMU&MIT搜集的,摆放在四个文件夹中。ImageNet:http://image-net.org/现在是时候构建一些通用的东西了。依据WordNet层次结构组织的图画数据库(现在仅为名词)。层次结构的每个节点都由数百个图画描述。现在,该集合平均每个节点有超越500个图画(而且还在增加)。Part5文本分类数据集
Spam–NonSpam:http://www.esp.uem.es/jmgomez/smsspamcorpus/区分短信是否为垃圾邮件是一个风趣的问题。你需求构建一个分类器将短信进行分类。TwitterSentimentAnalysis:http://thinknook.com/twitter-sentiment-analysis-training-corpus-dataset-2012-09-22/该数据集包括1578627个分类推文,每行被标记为1的积极心情,0位负面心情。数据顺次基于Kaggle竞赛和NickSanders的剖析。MovieReviewData:http://www.cs.cornell.edu/People/pabo/movie-review-data/这个网站供给了一系列的电影谈论文件,这些文件标示了他们的整体心情极性(正面或负面)或片面评价(例如,“两个半明星”)和对其片面性位置(片面或客观)或极性的标签。

未经允许不得转载:迅闻网 » mongodb数据基本单位(数据存储的网站叫什么)
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

迅闻网-让更多人看到你

登录/注册返回首页