failedtofetch-李成笔记网

2024年10月06日

DAGScheduler-Stage提交 dag-scheduler-event-loop

在DAGScheduler的handleJobSubmitted方法中，

 private[scheduler] def handleJobSubmitted(jobId: Int,
 finalRDD: RDD[_],
 func: (TaskContext, Iterator[_]) => _,
 partitions: Array[Int],
 callSite: CallSite,
 listener: JobListener,
 properties: Properties) {
 var finalStage: ResultStage = null
 try {
 // New stage creation may throw an exception if, for example, jobs are run on a
 // HadoopRDD whose underlying HDFS files have been deleted.
 // 如果作业运行在HadoopRDD上，而底层HDFS的文件已被删除，那么在创建新的Stage是将会抛出异常。
 finalStage = createResultStage(finalRDD, func, partitions, jobId, callSite)
 } catch {
 case e: Exception =>
 logWarning("Creating new stage failed due to exception - job: " + jobId, e)
 listener.jobFailed(e)
 return
 }
 
 val job = new ActiveJob(jobId, finalStage, callSite, listener, properties)
 clearCacheLocs()
 logInfo("Got job %s (%s) with %d output partitions".format(
 job.jobId, callSite.shortForm, partitions.length))
 logInfo("Final stage: " + finalStage + " (" + finalStage.name + ")")
 logInfo("Parents of final stage: " + finalStage.parents)
 logInfo("Missing parents: " + getMissingParentStages(finalStage))
 
 val jobSubmissionTime = clock.getTimeMillis()
 jobIdToActiveJob(jobId) = job
 activeJobs += job
 finalStage.setActiveJob(job)
 val stageIds = jobIdToStageIds(jobId).toArray
 val stageInfos = stageIds.flatMap(id => stageIdToStage.get(id).map(_.latestInfo))
 listenerBus.post(
 SparkListenerJobStart(job.jobId, jobSubmissionTime, stageInfos, properties))
 submitStage(finalStage)
 }

2024年10月06日

50组易混淆易用错词汇辨析易混易错词语辨析

1. bring, take, carry, fetch

bring拿来，take带走，carry随身携带，fetch去回这一往返动作 fetch a box of chalk

2. spend, take, pay, cost

spend人做主语，花钱，花时间; spend…on sth./in doing sth; take物做主语，花时间; pay人做主语，花钱，pay for; cost物做主语，花钱

3. live on, live by

2024年10月06日

字节跳动数据仓库架构团队负责数据仓库领域架构设计，支持字节跳动几乎所有产品线（包含但不限于抖音、今日头条、西瓜视频、火山视频）数据仓库方向的需求，如 Spark SQL / Druid 的二次开发和优化。字节跳动数据仓库架构负责人郭俊从 SparkSQL 的架构简介、字节跳动在 SparkSQL 引擎上的优化实践，以及字节跳动在 Spark Shuffle 稳定性提升和性能优化三个方面全方位地分享了字节跳动在 Spark SQL 上的核心优化的探索与实践。

2024年10月06日

RDD弹性特性弹性中dq/dp是什么意思

RDD作为弹性分布式数据集，弹性具体体现在

自动进行内存和磁盘数据存储的切换

Spark会优先把数据放到内存中，如果内存放不下，会放到磁盘里面。当应用程序内存不足时，Spark应用程序将数据自动从内存存储切换到磁盘存储，以保证其高效运行。

基于Lineage（血统）的高效容错机制

Lineage是基于Spark RDD的依赖关系来完成的，每个操作只关联其父操作，各个分片的数据之间互不影响，出现错误只需要恢复单个Split的特定部分即可。

2024年10月06日

error: RPC failed; curl 18 failed是什么意思

采坑笔记：

使用git下载文件时报错：error: RPC failed; curl 18 transfer closed with outstanding read data remain
1、缓存区溢出curl的postBuffer的默认值大小，需要增加

使用命令：git config --global http.postBuffer 524288000

524288000B也就500M左右

有时增加到500M还不行，直接加到2G

2024年10月06日

Java修炼终极指南:218 挂钩任务状态

从 JDK 19 开始，我们可以依赖 Future#state()。此方法基于众所周知的 get(), isDone(), 和 isCancelled() 计算 Future 的状态，并返回一个 Future.State 枚举项，如下所示：

2024年10月06日

Git遇到错误时如何解决的一些坑 git checkout error

初学者总是不知道如何学习，我一直建议你要拥有一本属于自己的学习课本，不管是基础，还是提升。

文章正文

在工作中，你总是与代码打交道，上传代码的时候，相信你不是用svn，就是用Git版本控制器，下面是最近这几天整理下来经常会遇到的Git的一些错误的解决访问，希望能帮助到你。

1 git pull遇到错误：error: Your local changes to the following files would be overwritten by merge:

2024年10月06日

前端面试29:什么是fetch?fetch与20年前的ajax有什么不同?

自从1998年发布IE5以来，浏览器中异步网络请求都是通过 XMLHttpRequest (XHR)。

这之后几年，Gmail等应用大量使用这种方法，使这种方法逐渐流行，并给它一个名字：AJAX。

直接使用XMLHttpRequest总是非常痛苦的，许多库都对这种方法进行了封装，特别地，jQuery封装的方法如下：

2024年10月06日

如何处理 git使用中push报错 git push出错

间隔了一段时间未往gitlab上push文件，近期使用时，发现push时报错，这里记录下解决处理的方法。

错误一：

[root@361way shell]# git push
warning: push.default is unset; its implicit value is changing in
Git 2.0 from 'matching' to 'simple'. To squelch this message
and maintain the current behavior after the default changes, use:
git config --global push.default matching
To squelch this message and adopt the new behavior now, use:
git config --global push.default simple
See 'git help config' and search for 'push.default' for further information.
(the 'simple' mode was introduced in Git 1.7.11. Use the similar mode
'current' instead of 'simple' if you sometimes use older versions of Git)

李成笔记网

专注域名、站长SEO知识分享与实战技巧

DAGScheduler-Stage提交 dag-scheduler-event-loop

Fetch API 教程 fetch_all

50组易混淆易用错词汇辨析易混易错词语辨析

字节跳动在 Spark SQL 上的核心优化实践

RDD弹性特性弹性中dq/dp是什么意思

error: RPC failed; curl 18 failed是什么意思

Java修炼终极指南:218 挂钩任务状态

Git遇到错误时如何解决的一些坑 git checkout error

前端面试29:什么是fetch?fetch与20年前的ajax有什么不同?

如何处理 git使用中push报错 git push出错